
從人臉識別到水表識別

博士畢業(yè)后,我就留在中科院自動化所模式識別國家重點實驗室,圍繞目標識別和人臉識別,在圖像和視頻分析領域展開深入研究。
這些年,我所研發(fā)的核心技術在聯想、京東、華為等多家公司產品中,進行了技術轉移和應用。期間,我還攜自主研發(fā)的人工智能機器人“小加”上央視一套《加油向未來》節(jié)目為眾人展示人臉識別技術。
說起來,來臺州從事水表識別研究也算巧合。4年前,汕頭大學的一位教授介紹我們來到臺州,說黃巖這邊有水表識別的需求。這家公司用的是人工抄表的方式,后來為了方便,就給每個抄表員發(fā)一個手機,用手機錄入。但是這種情況下,存在大量的估抄、漏抄等現象,導致很多漏水現象沒有及時發(fā)現,造成了大量水資源的浪費。于是,他們就想到做水表的自動拍照識別,找了好多人做水表識別,但都沒有成功。
我當時分析了下他們失敗的原因:一是水表比較臟,而且拍照的角度是任意的;二是字符是嵌入凹槽里面的,給識別帶來了很大困難;三是最后一個數字是半個的,這也給識別帶來了非常大的挑戰(zhàn)。
我們當時看了后,覺得很簡單,再加上合作伙伴對水行業(yè)非常熟悉和了解,就答應了下來。
耗時三年,換了幾十種方案

其實,很多技術是相通的。識別水表的數字是經典的字符識別問題,傳統(tǒng)最早的都是先檢測字符的位置,然后進行字符的分割,對每個字進行識別。這個過程跟人臉識別類似,但是他們的方法有很大不同。視覺抄表是把一串數字當做一個整體來進行識別,采用循環(huán)神經網絡的方式。
本來想著,3個月就能完成,結果一做就是3年。做科研項目和做一個產品還是有很大差別,更別說運營和推廣。
3年來,我們換了幾十種的方法和方案。比如,開始用手機去現場拍水表,后來發(fā)現手會抖動,抖動導致照片模糊影響識別效果,后來就加了防抖;另外就是為了拍照方便,我們設計了一個獨特的工具,用來方便抄表員打開水表蓋子,并支撐在水表表面進行拍照,這樣既保障了拍照的質量也固定了拍照的距離。
此外,為了記錄拍照的位置,我們保留了GPS位置信息,從而形成了一個抄表的路線軌跡,這樣即使抄表員換了,新的抄表員也可以順利地拍照。
這種改動,這幾年來我們做了太多太多的嘗試,才做到目前單個抄表員用我們的設備能一天拍800張左右的水表圖,而手工抄表的方式每天最多只能500張。
向全國推廣視覺抄表云

今年3月,我們才開始在臺州推廣。與其他公司不同,我們是在搭建好云服務和抄表系統(tǒng),并經過反復測試穩(wěn)定之后,才將產品推向市場。
我們最先在黃巖試用,不過,抄表員一開始比較抵制,因為要上傳圖片,對拍照也有要求,而且還有位置信息。為此,我們給抄表員進行培訓,讓他們更方便地使用我們的抄表系統(tǒng)。
經過幾個月的試用,抄表員的抄表效率大幅度地提升,而且所有數據都可以有效統(tǒng)一的回收,識別的精度也非常高。
因此,今年下半年,椒江、路橋等地的幾十家公司開始在使用視覺抄表云,在浙江以外也有多家開始在試用。
至于未來,我們將繼續(xù)在全國推廣我們的視覺抄表云。同時,針對北方水表在室內的情況,我們將采用微信小程序的方式,讓用戶自助拍照和上傳,更方便地進行收費。
除此之外,我們會對城市的用水、供水、調度等做一個城市用水的大數據分析平臺,建立一個城市用水大腦,方便對一個城市的水資源進行全方面智慧化的管理。這對于水資源的管理和合理利用具有非常重要的意義,我們會一直做下去。
對話

記者:現在越來越多專家將科研轉化成商業(yè)效益,你覺得這是大趨勢嗎,轉化中最困難的是什么?
我:科研不能一直都停留在實驗室,最終還是要轉化為生產力,可以說原來轉化的力度不大。隨著互聯網和人工智能技術的發(fā)展,再加上國家政策的支持,加速了科研產業(yè)化的進程,這也是我們科技發(fā)展的一個重要的趨勢。
在科技轉化中最難的就是技術到產品再到市場,科學家只是擅長做科研,對產品和市場缺乏認識,這種脫節(jié)是科技轉化的一個難點,因此如何找到與科學家互補的產品團隊和市場團隊,充分達成一致的合作協議,并能達到共同一致的目標,這是最關鍵的部分。
記者:你是如何理解創(chuàng)業(yè)的?
我:創(chuàng)業(yè)是非常辛苦和艱難的,不僅需要對行業(yè)痛點的敏銳洞察和科技方向的把控能力,更要能夠發(fā)現商業(yè)機會并快速占領市場。科學家創(chuàng)業(yè)其實主要是更想看到自己的技術能夠給人們的生活帶來便利和改善,對我們而言,能夠實現水資源的閉環(huán)管控,這是非常有價值的事情。盡管非常辛苦和艱難,但這個愿景給我們帶來了很多激情和動力,也是我們一直能堅持到現在的根本原因。
我
王金橋,1978年出生于河北衡水,2001年,本科畢業(yè)于河北工業(yè)大學機械學院。2004年,研究生畢業(yè)于天津大學機械學院機械電子工程系。2008年,博士畢業(yè)于中國科學院自動化研究所模式識別國家重點實驗室。2008年后,留所工作,目前任中科院自動化研究所研究員,智能媒體聯合實驗室主任、視頻云識別聯合實驗室主任,研究領域視頻大數據分析與識別,發(fā)表論文SCI/EI論文220篇,主持多個國家重大項目,有專利16項,國家標準3項。2014年,創(chuàng)辦臺州視讀信息技術有限公司,任首席科學家。