北京2018年8月1日電 /美通社/ -- 2018年7月26日,微軟小冰的第六代年度發(fā)布會上公布了“金融小冰”已化名上線了248天的消息?!敖鹑谛”敝铝τ谔峁?6類上市企業(yè)供稿摘要,而其中針對國內個人投資者及專業(yè)證券APP的“華小冰”則由華爾街見聞公司化名而來。
這是華小冰靜默開工的第248天。過去的200多天里,華小冰撰寫的金融資訊觸達了中國40%的個人投資者。
跟所有勤奮的金融資訊加工者一樣,華小冰必須保持高度的專業(yè)水準,對每天密集發(fā)布的26類上市公司公告,進行關鍵信息的提取、加工,并確保第一時間、準確地推送到投資者手中。金融資訊的特殊性,決定了這類信息的加工必須以毫秒為單位、且不能出現哪怕萬分之一的偏差。
直到2018年7月26日,微軟小冰的第六代年度發(fā)布會。一些細心的投資者發(fā)現,原來華小冰并不是一個人,而是懂金融的微軟小冰。
最懂金融的機器人
華小冰的“華”取自“華爾街見聞”,這家中國最有影響力的財經媒體,一直致力于內容與技術的雙輪驅動戰(zhàn)略。
曾首創(chuàng)金融信息7X24小時“實時”模式,通過同名華爾街見聞APP、選股寶APP、全天候科技等產品打造了強大的內容矩陣,為用戶提供優(yōu)質資訊、數據、行情、研究和社區(qū)等服務。此次聯(lián)手微軟,也可以視作華爾街見聞深耕內容AI技術的一次創(chuàng)新合作。
華爾街見聞旗下產品選股寶被稱為“最懂投資者”的A股產品。作為A股產品界的一匹黑馬,憑借領先的結構化A股資訊、強大精準的主題數據庫、海量用戶數據積累,在競爭激烈的A股產品中殺出重圍。
此次華小冰的誕生,正是微軟小冰與選股寶團隊深度合作的結果。雙方共同探索和應用小冰金融文本生成技術,并通過華爾街見聞、選股寶APP,將華小冰生成的智能資訊,分發(fā)至眾多合作券商APP,進而覆蓋多達40%的個人投資者。
攻克難關:AI寫作非標金融資訊
此次合作就是瞄準了金融資訊領域的用戶痛點 -- 上市公司公告AI寫作。公告是上市公司絕大多數重要信息的唯一出口,第一時間掌握相關上市公司披露的關鍵信息和背后意義,是所有二級市場投資者必須跨越的難關。
金融AI寫作一直是個理想豐滿、現實骨感的領域。一方面,上市公司公告由于是程式化文本,存在數量多、信息冗余的情況。而人工處理普遍存在時滯、缺漏等問題。另一方面,AI公告寫作也一直是未解難題。上市公司公告更接近非標準化金融資訊。雖然公告所包含信息元素相對確定,但上市公司公告格式不盡相同,且經常出現非標準化場景。因此,絕大部分的“金融AI寫作”僅僅是模板化的數據提取和填充,對于非標準化內容的加工顯得有些力不從心。
2016年艾媒咨詢(iMedia Research)的調查顯示,相較于汽車、家居、健康等媒體,財經類媒體的內容專業(yè)性較強,內容價值是其重要驅動力。因此,要讓機器人撰寫專業(yè)的財經內容,似乎還需要進行更艱難的探索。
華小冰則首度解決了金融領域的非標準化寫作難題。在借鑒傳統(tǒng) NLG 和語言模型方法的基礎上,結合華爾街見聞專業(yè)團隊對A股市場的理解和搜索數據庫層面積累的大數據,在模板基礎上進行語言生成,從而快速完成AI寫作。
華小冰誕生之初便開始經歷來自真實金融場景的嚴酷“訓練”。上百萬條人工訓練數據灌入、成百上千次的模型互調,很快讓這個上手才200天的“年輕人”,迅速成為處理過海量數據、經驗超群的“老司機”,甚至可以快速處理長達幾百頁的招股說明書。
全新探索:個性化行情播報、主題故事線
除了公告AI寫作,華小冰還將在個性化行情播報、主題故事線方面進行探索。
個性化播報不同于傳統(tǒng)的同一資訊池的“千人千面”,而是根據選股寶用戶畫像、結構化資訊標簽(如利好利空、大漲板塊和個股實時解盤)、行業(yè)主題數據庫等,對不同用戶智能化生成不同的播報文本,解決盯盤的個性化需求。
主題故事線,則是以選股寶行業(yè)主題數據庫為基礎,通過數據庫內精準的股票和資訊匹配,圍繞行業(yè)或概念主題,智能化生成歷史事件圖譜,方便投資者快速了解歷史脈絡和熱點,以便做出投資決策。