微軟發(fā)布Bot開發(fā)框架,用人工智能對話平臺豪賭未來
在談到 Tay 時,Satya Nadella 對彭博新聞的記者坦言:「我嚇壞了以至于不敢問它任何事情,因為誰知道它會說些什么呢?我甚至可能理解不了?!顾χf。
但他真的不使用 Tay,他說自己更喜歡更有企業(yè)風范的 Bot。在北京時間今天凌晨的主題演講中, Nadella 告訴場下以及全球的開發(fā)者們:「我們正在汲取人類語言中的強大能量,并將其廣泛的運用到電腦中去,我們認為這將產生重大影響,就像圖形用戶界面首次出現在桌面電腦或觸屏首次出現在智能手機上一樣?!?
Nadella 演講
「我們致力于將最好的技術應用在產品中,就在上周,當我們發(fā)布 Tay 時,我們很快意識到這并未達到這個要求?!宫F場發(fā)出一陣笑聲,不過 Nadella 繼續(xù)嚴肅的說:「所以,所以我們要回去重頭做起?!?
Nadella 將其定義為「對話平臺」。微軟展示了 Bot 的多種應用場景,比如你可以使用文本與 Bot 對話,如 Tay;而更豐富應用則是則寄托于開發(fā)者們,比如當你使用Skype 時,會有 Bot 「主動」為你規(guī)劃旅行路線或預定房間,抑或是盲人或視覺障礙者使用手機攝像頭調取 Bot 出來,從而幫助這些人「看見」別人的表情或圖書的內容。
所有 Bot 的開發(fā)工具和模版——Microsoft Bot Framework 都可以免費下載。開發(fā)人員可利用它將各種智能對話機器人集成到自己的應用中。微軟已經開發(fā)出6種工具幫助程序員創(chuàng)建機器人,微軟不僅希望程序員能夠快速上手,按照 Nadella 的想法,他還要三明治店、干洗店、汽車公司乃至無編程基礎的普通用戶都能開發(fā)一款屬于自己的 Bot。
微軟為何開始鐘情 Bot ?
Satya Nadella 兩年前成為微軟歷史上第三位 CEO,在微軟錯失移動互聯網的背景下,Satya Nadella 一上任就提出了「云優(yōu)先、移動優(yōu)先」的口號,大力推進以 Azure 為核心的云計算業(yè)務,成績斐然。在2016 年 1 月底的微軟第二財季財報中,微軟云服務(Azure+office365)收入增長 5%,達到 63 億美元,占到微軟第二財季總營收的 26%(總營收為 238 億美元)。如果考慮到微軟在 2010 年才開始發(fā)展云計算業(yè)務,這也就意味著,在 Satya Nadella 轉型理念的推動下,微軟的云計算營收已經支撐起了整個公司四分之一的營收。
說起微軟在移動尤其是手機領域的辛酸歷史,Satya Nadella 有自己的一番看法,「人們自然而然的以為:『因為你沒在手機應用商店中撈到甜頭。』」手機的應用程序當然很適合查看某項服務,但在搜集、重組、優(yōu)化并以自然的交互方式與用戶互動方面,Bot 的作用更重要。如果你想查看你的預算開支情況,你需要打開(記賬)的 App、等待你就加載出來所有的消費和收入。而通過一個基于某個聊天應用中的財務 Bot,你可能只需要一句話就能返回自己想要的結果。是不是很酷炫?
Nadella 從去年十月份才開始計劃微軟的戰(zhàn)略轉移,這也是他就任 CEO 以來,第一個真正屬于自己的戰(zhàn)略思考。
在從硅谷返回西雅圖的兩小時航班上,他與負責必應、Skype 、 Office 等應用和服務的陸奇和搜索工程部門副總裁 Derrick Connell 進行了會談。陸奇拿出自己的筆記本電腦,向 Nadella 展示了一些自己正在開發(fā)的人工智能的想法。他描述了一遍背后的科學原理,Nadella 問這對微軟的產品意味著什么。Connell 則向他展示了用人工智能強化過的新版本的 Outlook 電子郵件程序和 Skype。到飛機降落的時候,Nadella 決定,這就是微軟的轉型方向。
在早前的幾個月,陸奇在中國期間與中國的學生和客戶進行了深入交流,并實地了解到他們使用智能手機的方式。最讓他印象深刻的是中國人使用微信的方式。微信從一個最簡單的聊天應用,成長為一個類似操作系統(tǒng)的產品——用戶可以用微信預訂酒店、信用卡賬單分期、預約醫(yī)生、購買電影票以及在線購物。當越來越多的公司開始使用微信銷售自己的產品時,它們雇傭人類閱讀用戶發(fā)來的聊天信息,并積極回復從而完成銷售。
發(fā)信息「我想要兩張周五晚上的《死侍》的電影票。」陸奇說,然后你就能收到一張帶有時間和座位選擇的交互圖像,接下來,你只需要簡單地點擊購買,你就得到了一段取票的文本信息。然后你就可以去影院消費了,而且這樣操作的也不只是年輕人,陸奇表示,他 80 歲的母親也生活在「微信」中,這位住在上海的老人不信任網站,但她會在微信上購物和叫出租車。這些對話 Bot 的力量「有些已被微信發(fā)明出來,但現在 Facebook 看到這一點,很多公司都在打造類似的體驗?!龟懫嫜a充道,「我認為微軟會扮演一個領導者的角色。」
對話式的 bot 并非新鮮事物。第一個對話式的 Bot 可以回溯到早期的計算時代。MIT 研究員 Joseph Weizenbaum 在 1960 年代寫出了一個名叫 ELIZA 的 Bot。90年代后期在互聯網里為搜索引擎搜索網頁索引的爬蟲也是一種 Bot 。
Clippy
微軟在90年代也曾嘗試用 Bot 提高用戶交互體驗,其中一個便是類似大眼夾(Clippy)的 Office助手,但這個 Bot 很傻,它不知道何時出現,很多時候都是默認出現,也不會提出真正有用的建議,這個號稱基于貝葉斯算法的 Bot 幾乎毫無用處。
這一次,微軟要給自己的 Bot 來點不一樣的。
人工智能驅動的 Bot
正如陸奇所言,幾乎所有的大公司都將對話 Bot 作為重要的產品,而人工智能成為其背后強大的推動力。過去幾年,人工智能已經成為硅谷新的風向標。根據CB insight的統(tǒng)計,2015年,基于人工智能的創(chuàng)業(yè)公司共完成3億美金的融資,而在五年前的2010年,人工智能公司的融資總額只有4500萬美元。
以 Facebook 秘密開發(fā)的「M」為例,這是一個基于Facebook 聊天應用 Messager 里的對話 Bot,它可以幫你搜索、預訂機票、遞送免費咖啡、寫歌、甚至畫畫。當你和它聊天時,「M 」會通過自動化、深度學習、人工智能相結合的技術架構,并結合人類「教練」的建議,從而完成在海量數據的挖掘整理,快速回復。
Facebook M
而在微軟今天發(fā)布的「對話平臺(Conversations as a Platform)」,微軟希望將人工智能更靈活、更自然地融入到用戶的對話里。
第一,將 Cortana 作為交互 的核心。當開發(fā)者在Skype 上開發(fā)一款 Bot,微軟 Cortana 則可以從旁協助,甚至直接和機 Bot 進行溝通,讓使用體驗更順暢。比如用戶在為下一次的假期訂機票旅館時,Cortana 就可以適時地介入,從你過去的旅游經歷、甚至是之前的聊天內容中,提供建議。
第二,HoloLens 開發(fā)者版本發(fā)售。微軟不僅在新版本 Skype 里增加了視頻通話功能,還將支持 HoloLens。作為目前唯一不需要外部攝像頭、線纜、手機,也不需要連接PC,就可以提供自然全息計算的設備,Hololens 開發(fā)者版本的發(fā)售將給微軟的 Bot 帶來更多驚喜,這意味著用戶可以在任何地點啟動對話,并通過 Cortana 獲取幫助或建議。比如日本航空正在開發(fā)一款HoloLens 應用,其想象力空間非常大。
點擊查看原視頻鏈接
第三,推出HoloLens 模擬器。與 Hololens 開發(fā)者版本發(fā)售的同時,微軟還悄悄推出 HoloLens 模擬器,幫助沒有買到 Hololens 的開發(fā)者開發(fā)相關應用。利用 Hyper-V 虛擬機器,開發(fā)者同時使用微軟的 Visual Studio 開發(fā)工具就能做出類似于 HoloLens 上的功能。不再是依靠眼鏡的環(huán)境輸入,模擬器使用鍵盤和鼠標(或者Xbox控制器)進行控制,得到的回應和在 HoloLens 上操作一樣。進行控制時就像你打游戲,使用鍵盤的 WASD 按鍵進行移動控制,移動鼠標調節(jié)攝像頭。如果你打算開發(fā)全息應用,HoloToolkit on GitHub上提供很多腳本和組件,能夠加快開發(fā)進度。
第四,開放更多認知技術。此次大會上,微軟更新了一組機器學習工具,這些認知服務工具包共包含22項 API。其中的臉部識別程序也是去年朋友圈刷屏的「How old do you look」的基礎技術,也包括去年11月推出的可偵測面部情感的API,還包括語音識別以及智能自定義識別API等等。開發(fā)者可以隨時調用這些 API,將其加入到自己的 Bot 中。
第五,更簡單的 Bot 開發(fā)工具。Nadella 告訴彭博新聞記者,「這(Bot 開發(fā)工具)幾乎是我見過的最簡單的一段代碼?!挂晃晃④浌こ處煷蜷_ Bot 基礎模版,接著他添加了幾行代碼,從而讓 Bot 和 Domino 披薩店的點單系統(tǒng)連接起來,并設置了幾個選項,諸如披薩的尺寸和配料,然后這個 Bot 就完成了。試想一下,如果你在路上與朋友們用 Skype 聊天,而且每個人都想吃披薩,你就可以在不離開 Skype 的情況下快速預定披薩。
就在當天會議的最后,微軟展示正在處在研發(fā)階段的人工智能項目「Seeing AI」,利用計算機視覺和自然語言處理技術,通過這款下載在智能手機以及微軟合作的Pivothead 智能眼鏡的應用,盲人可以「看到」和「了解」他眼前的世界。視頻中,當盲人工程師薩科戴上 Pivothead 智能眼鏡時,滑動鏡腿就可以拍下眼前看到的景象,而 Seeing AI 則可以幫助薩科識別出景象,并通過語音告訴薩科眼前是什么,例如「一位男人在玩滑板,一個小女孩在公園扔飛盤」。當薩科在與人會談時,滑動鏡腿拍照,「Seeing AI」還可以識別出面前坐客的年齡、性別以及情緒,讓他可以向普通人一樣參與到真正的對話當中。當薩科在餐館點菜時,他可以拿出下載Seeing AI的智能手機,在人工智能的語音提示幫助下找到并對著菜單拍照,而Seeing AI可以自動讀出菜單,幫助他選擇自己想點的美食。
點擊查看原視頻鏈接
對微軟來說,在錯過移動互聯網浪潮之后,這一次的轉型對公司的未來至關重要。而從此次大會第一天所發(fā)布的產品和技術來說,微軟已經邁出了堅實的第一步,那么接下來呢?Nadella 比任何人都清楚實現這一目標有多么困難??赡苓€會有更多 Tay (不完美的產品)。彭博新聞記者記錄一個細節(jié):他靠在椅子上對自己的管理團隊微笑道:「這很困難,對吧?」