人類文明進步的每個階段都有一張代表性的標簽:19世紀是煤炭和蒸汽機,20世紀是石油和電力。今天,最具時代標志性的新事物則是大數據。正是由于海量數據的喂養,“互聯網+”與“人工智能”時代正迎來新的發展節點。
傳統的氣象服務行業也不例外。在行業人士看來,未來氣象行業的競爭,不僅僅是“雷達”等傳統氣象監測的競爭,更是依賴海量氣象數據的AI競爭,而從墨跡天氣的壯大軌跡中,也不難發現 “AI石油”大數據的基礎性作用。
數據成AI時代氣象服務業“石油” 三大數據來源支撐墨跡天氣強精準預測
對于氣象服務行業來說,要想要實現精準的短時預報,數據是實現目標的 “石油”。以目前全球最大的天氣服務類軟件墨跡天氣為例,憑借獨創的天氣大數據及AI相關技術,墨跡天氣可以提供精準到方圓500米以內、未來2小時的分鐘級預報。相比于傳統的預測準確率30%左右,短時預報的準確性普遍在80%以上。
之所以能在短時預報以及精準度上引領行業,數據基礎極為關鍵。墨跡天氣已成為全球專業氣象機構的重要合作方,以氣象數據為例,除了來自中國國家氣象局外,還包括美國氣象局的GFS、歐洲氣象局的EC等諸多機構,僅每天的數據量就高達500G。
其實,除了全球范圍內專業氣象機構外,墨跡天氣還有其它兩大數據來源:一個是通過“眾包模式”,利用獨有的用戶實時照片分享搭建用戶地理位置UGC平臺,每天會收到數十萬用戶的實況天氣報告,每天僅用戶實時發布的數據就有400GB;再者是借助具有傳感器的智能終端進行采集,比如墨跡天氣與魅族、華為、通用汽車等手機、智能硬件、汽車等的合作,每天大約有8000萬左右的數據。
即從數據體量來看,現在的墨跡天氣更像是一個天氣大數據平臺。一份公開數據顯示,在數據收集和處理方面,墨跡天氣擁有的用戶數量級每天融合后的數據達百億級,總數據量更是已經達到數千TB。有了海量的基礎數據,墨跡天氣能提供準確率在80%以上的高精準度短時預報也就不難理解。
“眾包數據”引領行業:超5億用戶成最大優勢
數據顯示,墨跡天氣支持196個國家、70多萬個城市及地區的生活類天氣查詢,截至目前,已擁有超過5億用戶,5000萬日活、1億月活,天氣日查詢次數過億。
在墨跡天氣看來,由于國土面積巨大,但擁有眾多人口,在氣象部門的觀測站分布有限的情況下,只要有更多的人可以成為活動監測站,就可以加大天氣觀測的密度,達到更精準的天氣預報。
為了能有效挖掘超5億用戶“金礦”,墨跡天氣創造性地推出“眾包數據”模式,作為傳統氣象官方數據的重要補充。早在2012年,墨跡天氣就搭建時景社區,為用戶提供氣象信息的實時分享互動平臺,據了解,在這一眾包平臺上,墨跡天氣每天會收到數十萬用戶的實況天氣報告,總氣象圖片資源達億級。
超5億用戶,5000萬日活用戶,墨跡天氣用戶粘性之大可見一斑,這也成為墨跡天氣未來在商業化探索上的重要基石。除此之外,用戶每天實時上傳的海量天氣數據,也為墨跡天氣提供更精準的天氣預報起到了重要輔助作用,而更精準的天氣數據也成為墨跡天氣向B端客戶提供專業的業務拓展、品牌內容營銷等建議的重要支撐。
業內分析指出,對于眾包數據的應用和利用是氣象行業未來發展的趨勢,墨跡天氣的龐大用戶群體就成為最大優勢之一。在豐富的氣象和出行數據以及每天十萬級別的用戶氣象反饋數據基礎上,墨跡天氣將傳統數據模式系統+深度機器學習相結合,已經成為引領大數據時代氣象服務行業發展的權威力量。