您好,歡迎進入美譽度品牌管理官網(wǎng)!

江蘇危機公關(guān)公司

一站式提供商

提供設(shè)計,生產(chǎn),安裝,售后服務一條龍服務

400-021-0821
公司資訊
您的位置: 主頁 > 新聞中心 > 公司資訊
大模型如何開啟輸入法的“iPhone時刻”?對話訊飛輸入法總經(jīng)理程坤
發(fā)布時間:2023-12-11 15:43瀏覽次數(shù):

美譽度品牌管理


大模型時代需要什么樣的輸入法?

進入21世紀第3個十年,人工智能迎來“智慧涌現(xiàn)”的大模型時代,鍵盤打字、整句聯(lián)想、斗圖……這些“傳統(tǒng)”的功能可能已經(jīng)無法滿足廣大用戶的個性化需求。

如何在產(chǎn)品形態(tài)已經(jīng)很成熟的情況下,不斷解構(gòu)用戶場景、挖掘用戶持續(xù)發(fā)展的需求,是頭部玩家的永恒命題。

在13周年之際,訊飛輸入法發(fā)布“面向下一代輸入法的生成式AI”,并帶來全新的13.0版本,開啟生成式AI輸入時代。

基于大模型的AI能力,訊飛輸入法13.0支持60多款應用,覆蓋6大表達場景,并率先開啟人機交互界面革新,推出全新的卡片式推薦區(qū)“活力視界”,在屏幕與按鍵之間采用雙行顯示,支持自由組合卡片功能,將傳統(tǒng)的文字呈現(xiàn)方式升級為“Feed流”式的交互體驗。

據(jù)悉,訊飛輸入法的“AI創(chuàng)作助手”于今年8月首次推出并開啟內(nèi)測。據(jù)訊飛官方數(shù)據(jù),經(jīng)過兩個多月的上線驗證,基于星火大模型的“AI創(chuàng)作助手”月累計請求量已超過6000萬次,用戶點贊率超過85%。此次升級,“AI創(chuàng)作助手”再次進化,致力于幫助用戶“智慧表達”和“智能連接”。

那么,訊飛輸入法13.0究竟能夠為用戶帶來什么樣的生成式AI新體驗?“生成式AI輸入法”與傳統(tǒng)輸入法相比,核心能力有哪些?大模型時代下,輸入法未來的發(fā)展趨勢是什么?

美譽度與訊飛輸入法總經(jīng)理程坤、訊飛輸入法產(chǎn)品總監(jiān)趙明路進行了深入交流,并第一時間試用了訊飛輸入法13.0,從中尋找這些問題的答案。

一、60+應用覆蓋6大場景,把深、厚、大的能力隱藏在薄頁面中

2010年,訊飛推出第一代訊飛輸入法,開啟了中文輸入法的語音輸入時代。

而現(xiàn)在,伴隨著“生成式AI”浪潮的到來,各個領(lǐng)域都迎來了“智慧涌現(xiàn)”的大模型時代,輸入法領(lǐng)域自然也發(fā)生著巨變。

下一代輸入法應該是什么樣的?具備智慧表達、智能連接兩大能力,自適應、自進化兩大特征的“生成式AI輸入法”,是訊飛輸入法團隊在這個新時代交出的首份答卷。

基于這兩大能力和特征,訊飛輸入法13.0提供了20余款AI創(chuàng)作助手,覆蓋6大場景、60多款應用。

訊飛輸入法13.0在人機交互上也進行了革新,上線業(yè)界首創(chuàng)的“活力視界”交互界面,在屏幕與按鍵之間采用雙行顯示,以創(chuàng)新式的卡片設(shè)計,實現(xiàn)Feed流式的交互體驗。

▲用戶可在菜單面板開啟“活力視界”界面

與傳統(tǒng)的文字候選欄相比,“活力視界”創(chuàng)新組合了Emoji(表情符號)、花樣字、斗圖等多樣化的候選建議,甚至輸入之外的擴展服務,內(nèi)容展示更加多元。

▲“活力視界”為用戶提供斗圖、Emoji等候選建議

從產(chǎn)品設(shè)計的角度來看,趙明路認為,一個好的產(chǎn)品應該用簡單的界面為用戶提供多維的價值。

“活力視界”作為連接傳統(tǒng)界面設(shè)計和全新AI功能服務之間的線索,通過一個簡單的兩行視窗,將產(chǎn)品背后豐富的AI能力矩陣呈現(xiàn)在用戶面前。

對于用戶來說,訊飛輸入法從交互方式上看起來,可能并沒有太大的變化,用戶也不需要花費較大的學習成本去理解其中的層級結(jié)構(gòu)。只要用戶能更便捷地使用服務,在使用中能感受到“更懂我”,就是訊飛想要達到的效果。

▲趙明路解讀訊飛輸入法13.0的產(chǎn)品創(chuàng)新

程坤告訴美譽度,生成式AI輸入法的意義和價值,可以從兩個層面來理解,也就是智慧表達和智慧連接這兩大能力。

1、智慧表達:有大腦、有思想、有靈魂的輸入法

首先,從用戶角度來看,生成式AI技術(shù)相當于為輸入法加上了“大腦”。

上一代輸入法只能做文字輸入,而現(xiàn)在通過生成式AI賦能,輸入法不僅能幫助用戶把靈感更好地表達出來,還能激發(fā)更多創(chuàng)意。

智慧表達能力主要分為三個場景,在用戶輸入的各個時機,即輸入前、輸入中、輸入后,以不同的方式完善用戶的表達。

一是在輸入前智能生成?;趯ι舷挛膬?nèi)容的理解,結(jié)合不同表達需求智能生成內(nèi)容,主動替用戶表達。

例如,當用戶處于聊天、發(fā)布、評論、評價等不同場景的輸入框時,“活力視界”右端的推薦欄會自動根據(jù)場景需求,提供不同的功能。

美譽度分別選取了朋友圈、微博、淘寶、小紅書這四個應用場景體驗,訊飛輸入法均自動提供了相應風格的文案。

▲訊飛輸入法在朋友圈、微博、淘寶生成不同風格的文案

同樣的,在文案生成后,用戶可以通過下方的指令切換不同的風格。例如訊飛輸入法生成下面這段小紅書文案后,我希望它能提供一個更簡短的版本,點擊“語言簡練點”即可重新生成更符合需求的文案。

▲使用訊飛輸入法生成小紅書文案(動圖有加速)

二是在輸入中智能補全?;谟脩粢呀?jīng)輸入的內(nèi)容,訊飛輸入法13.0能幫助用戶補全句子或續(xù)寫文章。

在補全句子后,用戶可以繼續(xù)在下方選擇第二次指令,如引用名言、增加Emoji、改變語氣等。

▲擴寫句子后,用戶可點擊下方指令為文字增加Emoji

三是在輸入后智能潤色?;谟脩粼诹奶臁⒃u論、發(fā)布等不同場景中輸入的內(nèi)容,結(jié)合用戶表達習慣或需求,對用戶的表達進行應情應景的智能潤色。

▲智能潤色后,用戶點擊下方指令可二次生成不同風格文字

2、智能連接:理解用戶意圖,以用戶為中心連接萬物

其次,從輸入法品類角度來看,生成式AI能夠幫助輸入法從工具型應用向服務型應用轉(zhuǎn)型,無論是輸入法App內(nèi)還是跨App應用,都能將用戶與其輸入后想要的服務連接起來。

智能連接能力主要體現(xiàn)在連接輸入場景內(nèi)外多元服務上,在不同的場景主動為用戶提供不同的功能選擇。

其中比較具有代表性的功能是AI剪貼板。用戶無需輸入任何內(nèi)容,只需復制想要回復的消息,“活力視界”窗口就會自動彈出AI剪貼板功能,并提供智能回復等選項。

▲只需復制消息,AI剪貼板就可以提供智能回復

此外,在AI剪貼板中右滑,可以看到拆詞、翻譯、搜索等更多功能,點擊“翻譯”即可自動翻譯剪貼板中的內(nèi)容。

▲AI剪貼板自動翻譯用戶剪貼板內(nèi)容

AI剪貼板提供的翻譯功能,也是訊飛輸入法智能連接能力的體現(xiàn)——連接輸入場景之外的內(nèi)容與服務,用戶無需切換至翻譯應用,即可獲得文字翻譯功能。

二、推出首個輸入法認知大模型,打造“1+N+X”生態(tài)的重要一環(huán)

10月24日,訊飛發(fā)布星火認知大模型V3.0,與70天前剛剛發(fā)布的星火大模型V2.0相比,文本生成、語言理解、多模態(tài)等七大能力全面提升,全面對標ChatGPT。

訊飛采取了“1+N(重大行業(yè))+X(細分行業(yè)及產(chǎn)品)”的生態(tài)體系戰(zhàn)略,而訊飛輸入法,則是其中的“N”環(huán)節(jié)里,“智慧輸入”這一賽道的應用,是整個生態(tài)系統(tǒng)布局的重要一環(huán)。

在星火大模型V3.0的基礎(chǔ)上,訊飛為輸入法量身定制了首個輸入法認知大模型,涵蓋文本生成、多語言語音、多模態(tài)生成等生成式AI能力矩陣。

首先,文本生成能力是訊飛輸入法的基礎(chǔ)與核心能力,也是智慧涌現(xiàn)開始的地方。

在多語言語音能力上,訊飛輸入法在去年率先發(fā)布了語音個性化方言免切換系統(tǒng),對整個方言語音系統(tǒng)的使用有極大促進。從今年6月到9月,短短三個月內(nèi),訊飛輸入法閩南話的使用率提升了1177%。

在此基礎(chǔ)上,今年,訊飛輸入法額外構(gòu)建了多語言語音大模型,將識別、翻譯、語種分類多任務聚合,達到信息共享互通的目的,實現(xiàn)語種免切換識別、語音到目標語種自動翻譯以及領(lǐng)域識別效果增強。

目前,訊飛輸入法13.0多語種自動識別覆蓋了37種語言,端到端語音翻譯超過13個,在多語言識別的通用效果上也提升了30%。

在多模態(tài)生成能力上,基于訊飛星火多模態(tài)大模型,輸入法認知大模型將多模態(tài)對齊到統(tǒng)一語義空間中,通過兩種方式,即多模態(tài)理解和多模態(tài)生成兩種任務的協(xié)同訓練,來實現(xiàn)多模態(tài)的協(xié)同。

目前,訊飛輸入法逐漸開始落地應用多模態(tài)生成式AI的能力,如AI皮膚、AI頭像、AI造字等,為輸入法的個性化帶來更多可能性。

▲訊飛輸入法AI皮膚、AI頭像、AI造字界面

除了最基本的生成化特點以外,訊飛認為,新一代輸入法認知大模型還應具備個性化、場景化、自進化的特點。

在自進化和場景化方面,研發(fā)團隊結(jié)合對比學習,構(gòu)建了大量正例和負例用于訓練Reward Model(獎勵模型),并提出了4種Reward Model訓練方法,可以在不需要外接人工干預的情況下,實現(xiàn)大模型的常態(tài)化自更新。

上一代的輸入法其實已經(jīng)具備很多功能,包括不同的輸入模式、不同的鍵位、多種外部功能等。如果對每個功能和項目都進行單獨建模,整個系統(tǒng)融合起來的難度是很大的。

針對這個問題,訊飛輸入法研發(fā)團隊提出名為ALL-IN-ONE的統(tǒng)一模型架構(gòu),利用Prompt(提示詞)做任務引導,將不同的任務進行分解耦合訓練。除了提高整個系統(tǒng)的穩(wěn)定性,對可用性、安全性也有很大的提升。

▲科大訊飛AI研究院副院長丁克玉解讀統(tǒng)一建模與自進化

在個性化方面,面向C端時,大模型的個性化問題一直是業(yè)界難題,因為企業(yè)無法為每個用戶構(gòu)建一個專屬的大模型。

對此,訊飛輸入法研發(fā)團隊提出了Low-Rank個性化定制方法,通過將模型尺寸降低到認知大模型的十萬分甚至百萬分之一,來使小規(guī)模的個性化模型能夠在手機等移動設(shè)備上順利運行。

具體來說,Low-Rank通過使用場景和相關(guān)的用戶操作記錄下來,在端側(cè)訓練小模型,既實現(xiàn)了個性化,又保障了用戶信息的安全。

三、13年堅持聚焦用戶需求,開啟輸入法領(lǐng)域的“iPhone時刻”

今年3月,英偉達CEO黃仁勛曾在演講中說,AI的“iPhone時刻”正在到來。

而訊飛輸入法,想要開啟輸入法領(lǐng)域的“iPhone時刻”。

13年前,訊飛推出第一代訊飛輸入法,開創(chuàng)了中文語音輸入法的先河。趙明路稱,這其實就是一個小小的“iPhone時刻”。

數(shù)據(jù)顯示,與去年同期相比,訊飛輸入法日語音滲透率提升18%,日語音調(diào)用量提升35%,00后用戶占比提升17%,日活躍用戶規(guī)模提升10%,用戶規(guī)模保持高速增長,產(chǎn)品核心指標蟬聯(lián)行業(yè)第一。

▲訊飛輸入法產(chǎn)品核心指標提升數(shù)據(jù)

作為一款十幾年的“老產(chǎn)品”,尤其是在輸入法市場規(guī)模增長緩慢的情況下,訊飛輸入法能夠做到年化10%的活躍用戶增幅,離不開團隊持續(xù)13年對用戶需求的深入觀察,以及對新興技術(shù)的持續(xù)跟進。

▲訊飛輸入法內(nèi)容生態(tài)總監(jiān)盧潔解讀用戶洞察

回顧訊飛輸入法13年的發(fā)展歷程,程坤告訴美譽度,有幾個特別的節(jié)點對訊飛輸入法的發(fā)展非常關(guān)鍵。

首先是2010年,訊飛輸入法誕生的日子。當時,這款產(chǎn)品的名字還叫“訊飛語音輸入法”,是首款中文語音輸入法,它開啟了上一代輸入法的“語音輸入時代”。

其次是2012年,訊飛輸入法率先將DNN(深度神經(jīng)網(wǎng)絡(luò))應用到語音識別任務中,相對于傳統(tǒng)的模型算法使識別效果獲得大幅提升,標志著語音輸入從“可用”向“好用”發(fā)展。

2016年,訊飛與錘子手機合作,首次在萬人體育場演示語音輸入,使語音輸入為更多人所知,用戶量也獲得爆發(fā)式增長,月活突破1億,達到1.1億規(guī)模。

2018年作為一個起點,訊飛輸入法開始全面擁抱年輕人,先后上線了有趣的、DIY功能、交流社區(qū)以及內(nèi)容開放平臺,開始由提升效率向表達個性的方向發(fā)展。

而如今在2023年,伴隨著新生用戶的需求增長和大模型時代新技術(shù)的賦能,訊飛輸入法探索在產(chǎn)品功能、內(nèi)容生態(tài)多方面應用生成式AI技術(shù),想要開啟輸入法的生成式AI時代。

趙明路告訴美譽度,如果要用一句話來形容訊飛輸入法13.0與12.0相比最大的革新,那就是——全面擁抱生成式AI。

趙明路稱,用戶的需求、技術(shù)的發(fā)展,始終是訊飛輸入法團隊不斷創(chuàng)新、不斷進行產(chǎn)品迭代的最大驅(qū)動力。

星火大模型提供堅實的技術(shù)底座,對用戶需求的敏銳洞察提供產(chǎn)品創(chuàng)新的動力,在技術(shù)和產(chǎn)品的雙向驅(qū)動下,訊飛輸入法筑起“護城河”,成為輸入法品類中的佼佼者。

生成式AI輸入法不會是終點。在訊飛輸入法研發(fā)團隊看來,它更像是一個分水嶺,一個新的發(fā)展趨勢。

程坤談道,從長遠來看,未來,每個人都會有一個智能助理。輸入法作為一個既被高頻使用,又能跨場景、跨應用的品類,能夠連接不同應用之間的“孤島”,同時又將大模型理解、推理、生成、多模態(tài)等優(yōu)勢能力發(fā)揮出來。

無論是交互界面上的重塑,還是AI功能的增加和深入,都有可能成為繼語音輸入后,下一個融入每個人生活中難以割舍的用戶習慣。

結(jié)語:輸入法開啟生成式AI輸入新時代

輸入法是智能手機、平板、電腦、智慧屏等帶屏智能終端所必備的軟件產(chǎn)品,滲透到每一位用戶的日常生活中。

在大模型時代,正如程坤所說,生成式AI在輸入法中的應用落地是一個必然的趨勢。不僅是訊飛,市面上其他頭部輸入法廠商也都在做相關(guān)的嘗試。

不同于傳統(tǒng)的拼音、手寫或語音輸入,生成式AI輸入無論是在內(nèi)容的玩法、表達的多樣性,還是在服務連接能力上,都能提供更多的想象空間。輸入法不再是一個冷冰冰的工具,而是更懂用戶、為每個用戶量身定制的個性化產(chǎn)品。

400-021-0821