語音(yīn)交互所滿足的(de)需求語音(yīn)交互能滿足用(yòng)戶怎樣的(de)需求?或者說,我們在設計一款“語音(yīn)交互類産品”時(shí),應著(zhe)重考慮哪些方面的(de)“痛點”?1. 快(kuài)捷性以定鬧鐘(zhōng)爲例,目前我用(yòng)的(de)是IPhone7,我如果想通(tōng)過傳統方式定鬧鐘(zhōng),我的(de)流程是:亮屏-上劃打開控制欄-點擊圖标-選擇鬧鐘(zhōng)-定鬧鐘(zhōng)-結束(因爲我的(de)控制中心沒有添加鬧鐘(zhōng),而是秒表,所以需要多(duō)一步驟)。而如果通(tōng)過語音(yīn)助手,我隻需要:嘿,Siri(啓動Siri)-幫我訂一個(gè)明(míng)早 8 點的(de)鬧鐘(zhōng)-結束。
因此“語音(yīn)交互”所需要滿足的(de)很重要一點就是操作便捷性,能動動嘴皮子就解決的(de)事,往往會比動手來(lái)的(de)輕松很多(duō)。若是一款語音(yīn)交互産品,給用(yòng)戶的(de)感覺就是我說了(le)半天都解決不了(le)我的(de)需求,還(hái)不如我直接點手機來(lái)得(de)快(kuài),那無疑它是失敗的(de)。2. 安全性最直接的(de)場(chǎng)景——開車。雖然明(míng)文規定開車的(de)時(shí)候不許接打電話(huà),但實際生活中仍有很多(duō)人(rén)還(hái)是會在駕駛途中接電話(huà)。即使有耳機,在有電話(huà)接進來(lái)的(de)時(shí)候往往也(yě)需要我們再按一下(xià)相應的(de)按鍵,才能接聽(tīng)。但在有“語音(yīn)助手”的(de)情況下(xià),我們也(yě)許隻需要說一聲“接聽(tīng)”就可(kě)以了(le)。包括我們臨時(shí)有急事想要撥打電話(huà)給别人(rén)時(shí),同樣可(kě)以滿足對(duì)應需求。
因此在很多(duō)時(shí)候,如果産品的(de)語音(yīn)交互功能完善,就可(kě)以爲用(yòng)戶解決很多(duō)煩惱,同樣也(yě)可(kě)以避免很多(duō)安全事故的(de)發生,因爲這(zhè)個(gè)時(shí)候人(rén)的(de)注意力不需要再集中在操作設備身上,隻需要簡單說幾句話(huà)就可(kě)以解決一切。3. 差異性“語音(yīn)交互産品”更可(kě)以解決不同設備之間的(de)信息流轉問題,這(zhè)就是未來(lái)的(de)智能家居概念,通(tōng)過語音(yīn)來(lái)控制所有的(de)家具設備。因爲不同的(de)設備在輸入方式的(de)選擇上可(kě)能會存在差異,比如:有些是按鍵,有些是觸摸等,但如果所有家具都能利用(yòng)“語音(yīn)交互”來(lái)完成相應的(de)控制,那一切就會随心所欲很多(duō),而需求往往同樣對(duì)應著(zhe)合适的(de)場(chǎng)景。适合語音(yīn)交互的(de)場(chǎng)景目前很多(duō)的(de)現有場(chǎng)景其實都适合添加“語音(yīn)交互”的(de)元素進去,所以我們簡單地将其概括爲三方面。1. 追求高(gāo)效高(gāo)效性适用(yòng)于很多(duō)場(chǎng)景,比如辦公場(chǎng)景:給XXX發送一封郵件,郵件内容是***;比如生活場(chǎng)景:我要去某地,請從我當前所在位置爲我找一種時(shí)間最短的(de)出行方式。諸如此類還(hái)有很多(duō),用(yòng)戶追求的(de)就是足夠的(de)快(kuài)速,足夠的(de)方便。講一句話(huà)需要多(duō)久呢(ne)?2. 偏向執行結果導向,用(yòng)戶關注的(de)是事情或者命令執行的(de)結果,并不關心過程。比如:用(yòng)戶想要查詢他(tā)買的(de)股票(piào)是漲了(le)還(hái)是跌了(le),對(duì)他(tā)來(lái)說也(yě)許關心的(de)隻是最後呈現的(de)這(zhè)麽一個(gè)結果,那他(tā)隻需要通(tōng)過語音(yīn)助手詢問即可(kě)獲知。因爲本身通(tōng)過“語音(yīn)交互”執行命令時(shí),用(yòng)戶就已經放棄了(le)操作的(de)過程,設備已經把所有的(de)過程通(tōng)過用(yòng)戶的(de)一句話(huà)給省略了(le)。
有些時(shí)候我們在進行網上購(gòu)物(wù)的(de)時(shí)候,也(yě)許用(yòng)戶就不會選擇用(yòng)“語音(yīn)助手”來(lái)做(zuò)推薦,因爲大(dà)部分(fēn)的(de)用(yòng)戶樂(yuè)于享受浏覽琳琅滿目的(de)商品的(de)過程。但同樣也(yě)有很多(duō)時(shí)候用(yòng)戶隻想快(kuài)點結束過程,好達到目的(de),比如獲知天氣、定鬧鐘(zhōng)、查路線等。此種場(chǎng)景也(yě)多(duō)見于“工具型”産品中。
但基于目前的(de)一個(gè)技術限制,“語音(yīn)交互”功能本身也(yě)是偏向結果的(de),即用(yòng)戶較難從一次語音(yīn)交互過程中獲得(de)什(shén)麽享受。3. 設備優勢即可(kě)以通(tōng)過語音(yīn)來(lái)實現遠(yuǎn)程控制設備,我們不需要去觸摸設備,不需要有其他(tā)操作,隻需說一聲,設備就能運轉起來(lái)。也(yě)許是簡單的(de)讓放在桌上的(de)手機設置一個(gè)鬧鐘(zhōng),也(yě)許是讓家中的(de)電器開始運作。通(tōng)過“語音(yīn)交互”,我們确實能消除很多(duō)由于空間而帶來(lái)的(de)限制。
那基于此,有适合“語音(yīn)交互”發揮其功能的(de)場(chǎng)景,同樣會有不适合語音(yīn)交互的(de)場(chǎng)景。不适合語音(yīn)交互的(de)場(chǎng)景場(chǎng)景大(dà)緻也(yě)分(fēn)爲三種:1. 嘈雜(zá)環境在這(zhè)個(gè)時(shí)候,影(yǐng)響的(de)主要就是ASR(語音(yīn)識别)與TTS(文本到語音(yīn))這(zhè)兩個(gè)環節,一個(gè)是人(rén)對(duì)設備說話(huà),還(hái)有一個(gè)是設備反饋給用(yòng)戶聲音(yīn)。如果環境很吵鬧,首先就會影(yǐng)響機器聽(tīng)取用(yòng)戶的(de)聲音(yīn),在将語音(yīn)轉文字這(zhè)一環節就容易産生偏差,直接導緻後續的(de)“自然語言環節”出錯,從而毀壞接下(xià)來(lái)所有的(de)流程。
而同樣,周圍聲音(yīn)吵,機器有反饋用(yòng)戶也(yě)可(kě)能聽(tīng)不清,從而也(yě)容易對(duì)機器發出的(de)聲音(yīn)産生誤解。
其實這(zhè)點在日常生活中就能明(míng)白,如果周圍很吵,一般不會有人(rén)還(hái)會去使用(yòng)“語音(yīn)助手”。2. 交流發散這(zhè)個(gè)主要是考慮到目前的(de)一個(gè)“語音(yīn)交互”技術發展的(de)程度,現在我們絕大(dà)多(duō)數時(shí)候使用(yòng)相關的(de)語音(yīn)助手,目的(de)一般都是很明(míng)确的(de)。解決一個(gè)問題或者制定一個(gè)任務,往往是結果導向,隻要設備實現了(le)我的(de)這(zhè)麽一個(gè)要求,那麽這(zhè)次“語音(yīn)交互”就可(kě)以算(suàn)是成功的(de)。
而“交流發散”指的(de)是什(shén)麽呢(ne)?
它主要說的(de)是用(yòng)戶與設備如兩人(rén)閑聊一般聊天,即交流沒有目的(de)性,這(zhè)樣子的(de)對(duì)話(huà)産生的(de)内容是呈發散性的(de),生活中的(de)例子,比如:“調戲Siri”,很多(duō)用(yòng)戶用(yòng)各種話(huà)來(lái)測試Siri,期待一個(gè)回答(dá)。但由于目前的(de)技術限制,語音(yīn)交互還(hái)遠(yuǎn)遠(yuǎn)無法實現“交流”,即如果用(yòng)戶注重過程,那麽其實是沒那麽理(lǐ)想的(de)。3. 過長(cháng)流程這(zhè)一點上其實與“交流發散”都有點類似,即追求結果,那麽勢必過程就會變得(de)其次。因此如果用(yòng)戶在使用(yòng)“語音(yīn)交互”時(shí)流程過長(cháng),往往會得(de)到不好的(de)體驗;或者說,本身這(zhè)個(gè)指令的(de)過程就是比較冗長(cháng)的(de),以目前的(de)技術也(yě)許根本不适合采用(yòng)“語音(yīn)交互”技術。
其他(tā)不适合的(de)場(chǎng)景其實還(hái)有很多(duō),比如:重視視覺效果的(de)場(chǎng)景。“點外賣”,雖然我們之前經常會用(yòng)這(zhè)個(gè)來(lái)舉例,但就現在來(lái)說,如果使用(yòng)語音(yīn)助手點外賣,稍稍顯得(de)有點沒必要。
因爲我們點外賣,包括購(gòu)物(wù),其實很看重視覺體驗,你總不能光(guāng)靠聽(tīng)聲音(yīn)就知道這(zhè)個(gè)商品的(de)成色等,而且同時(shí)本身它的(de)流程也(yě)比較長(cháng),可(kě)能還(hái)包括手動确定訂單、支付金額(也(yě)許會有聲紋認證)等步驟,還(hái)無法完全依靠“語音(yīn)交互”來(lái)實現。
之前我們一直說,就目前的(de)“語音(yīn)交互”的(de)應用(yòng)來(lái)說,往往能實現的(de)功能都是偏結果型的(de),因此一段語音(yīn)交互對(duì)話(huà),其實是帶著(zhe)目的(de)性的(de)(與設備産生互動其實也(yě)是帶著(zhe)“消遣時(shí)間”的(de)目的(de)),或者說,設備是帶著(zhe)任務來(lái)與用(yòng)戶産生此次對(duì)話(huà)的(de)。任務型對(duì)話(huà)的(de)概念任務型對(duì)話(huà):其目标是爲了(le)達成用(yòng)戶所希望完成的(de)任務,滿足用(yòng)戶有直接目的(de)的(de)需求。(如:定鬧鐘(zhōng)、查路線等)
在這(zhè)裏,可(kě)以将這(zhè)麽一段“任務型對(duì)話(huà)”簡單分(fēn)成三個(gè)部分(fēn):1. 意圖定義設備需要分(fēn)析用(yòng)戶想要幹嘛,也(yě)就是理(lǐ)解用(yòng)戶需求。隻有在充分(fēn)理(lǐ)解用(yòng)戶需求的(de)基礎上,才能設計出一款成功的(de)産品。基于這(zhè)個(gè)道理(lǐ),同樣要建立在理(lǐ)解用(yòng)戶想法上來(lái)去開展接下(xià)來(lái)的(de)對(duì)話(huà)流程。2. 槽位定義“槽位”是什(shén)麽?
在“語音(yīn)交互”中,它可(kě)以被理(lǐ)解爲“關鍵字”,設備想要完成執行用(yòng)戶所下(xià)達的(de)任務,它必須清楚地知道這(zhè)個(gè)任務究竟是什(shén)麽,這(zhè)就涉及到對(duì)一段話(huà)中槽位的(de)匹配。
我們舉兩個(gè)例子:
(1)定鬧鐘(zhōng)——“我要定個(gè)鬧鐘(zhōng)”
很顯然,這(zhè)是不完整的(de),給你定什(shén)麽時(shí)候的(de)?幾點的(de)?
在這(zhè)裏,時(shí)間的(de)槽位就是缺失的(de),導緻設備無法執行命令。
好,那這(zhè)個(gè)時(shí)候,用(yòng)戶說“給我定個(gè)八點的(de)鬧鐘(zhōng)”。這(zhè)時(shí)候完整了(le)嗎?其實還(hái)是沒有完整,因爲不知道是早上八點還(hái)是晚上八點,時(shí)間的(de)槽位依然沒有明(míng)确定義,這(zhè)次的(de)任務依然無法執行。
最後用(yòng)戶說“給我定一個(gè)明(míng)天早上八點的(de)鬧鐘(zhōng)”,這(zhè)個(gè)時(shí)候,相應的(de)槽位就補充完整,可(kě)以正常執行。
(2)打電話(huà)——這(zhè)也(yě)是我們很常用(yòng)的(de)的(de)“語音(yīn)交互”功能。
用(yòng)戶說“我要打個(gè)電話(huà)”,同樣,打電話(huà)給誰?電話(huà)對(duì)象這(zhè)個(gè)槽位缺失。
接下(xià)來(lái),是“給李四打個(gè)電話(huà)”,這(zhè)麽一看貌似已經沒錯了(le),對(duì)象也(yě)有了(le),具體指令也(yě)有了(le),但其實還(hái)是存在隐患,萬一用(yòng)戶的(de)手機是雙卡的(de)呢(ne)?其實任務依然無法執行,因爲設備不知道用(yòng)戶會選擇哪張卡來(lái)進行撥号,也(yě)許可(kě)以提前設置默認号碼,但同樣這(zhè)也(yě)是槽位之一。
而且很多(duō)用(yòng)戶也(yě)許會給自己的(de)聯系人(rén)設置備注,或者出現同名的(de)情況,比如:用(yòng)戶手機裏有兩個(gè)叫李四的(de)聯系人(rén),這(zhè)時(shí)候設備還(hái)應該去詢問“要撥打給哪個(gè)李四”。
因此在設計這(zhè)麽一款語音(yīn)交互産品時(shí),就槽位判斷的(de)準确性是很重要的(de),一旦産生誤解,或者對(duì)槽位未精确定位,相關操作就無法執行。3. 流程分(fēn)支這(zhè)個(gè)就和(hé)槽位定義相互關聯,因爲在一場(chǎng)“語音(yīn)交互”過程中,順利的(de)話(huà)也(yě)許用(yòng)戶一開始就把所有槽位都說到了(le),那麽設備就可(kě)以直接執行命令。如果出現槽位缺失,那麽設備這(zhè)時(shí)候就應該提示用(yòng)戶補充相應的(de)槽位。
但流程分(fēn)支,不光(guāng)包括“槽位缺失”這(zhè)一情況,還(hái)會存在“增加指令”(如用(yòng)戶還(hái)需要在定一個(gè)鬧鐘(zhōng))、“放棄指令”(用(yòng)戶操作到一半,突然選擇放棄)、“删除任務”(如删除此前設置好的(de)鬧鐘(zhōng))、“修改指令”(用(yòng)戶一開始定的(de)早上 8 點的(de)鬧鐘(zhōng),操作中突然說要把這(zhè)個(gè)鬧鐘(zhōng)改到 9 點)等等,這(zhè)裏就不一一列舉。任務型對(duì)話(huà)的(de)流程設計與做(zuò)APP一樣,在設計“任務型對(duì)話(huà)”的(de)流程時(shí),我們同樣需要考慮盡可(kě)能多(duō)的(de)操作與情景。1. 槽位完整表達時(shí)以定鬧鐘(zhōng)爲例,“設置一個(gè)明(míng)早八點的(de)鬧鈴”:設置鬧鈴是相應需要執行的(de)操作,明(míng)早是日期,八點是具體時(shí)間。因此這(zhè)樣一段對(duì)話(huà)其槽位都是完整的(de),流程也(yě)是最簡單的(de),因爲用(yòng)戶已經把所有的(de)信息都說完整了(le),設備隻需要執行就可(kě)以了(le)。2. 槽位部分(fēn)表達時(shí)“明(míng)天叫我起床”,顯然缺少具體時(shí)間的(de)槽位,雖然相應的(de)執行操作内容是完整的(de),但因爲缺失信息,依然導緻任務無法完成,所以設備會發起新一輪的(de)對(duì)話(huà),要求用(yòng)戶補充對(duì)應确實的(de)槽位。
這(zhè)種情況相對(duì)也(yě)常見,很多(duō)用(yòng)戶會先說:“給我定個(gè)鬧鐘(zhōng)”,等到機器響應之後,再說“定到明(míng)天早上八點”。3. 含有分(fēn)支流程時(shí)即在一輪對(duì)話(huà)中,即使用(yòng)戶槽位表達完整,但因爲出現了(le)分(fēn)支情況,導緻任務依然無法立刻執行。比如:用(yòng)戶說“打電話(huà)給張三”,但也(yě)許用(yòng)戶不止有一張卡,這(zhè)個(gè)時(shí)候就産生了(le)“用(yòng)哪張卡撥号”的(de)分(fēn)支;也(yě)許用(yòng)戶通(tōng)訊錄中不止有一位聯系人(rén)叫張三的(de),那這(zhè)個(gè)時(shí)候的(de)分(fēn)支流程又變成了(le)“呼叫哪個(gè)張三”的(de)情況。
類似這(zhè)種,在一輪“任務對(duì)話(huà)”過程中,出現了(le)分(fēn)支流程時(shí),對(duì)應的(de)操作又應該怎麽設計,這(zhè)就要求産品經理(lǐ)能充分(fēn)考慮到用(yòng)戶在不同情況下(xià)的(de)一個(gè)需求,從而進一步完善相對(duì)應的(de)功能。4. 主動或意外退出時(shí)也(yě)許是設備還(hái)沒有執行完成任務時(shí),突然退出的(de)情況,在這(zhè)裏包括:用(yòng)戶關閉相關功能、用(yòng)戶放棄操作等情況。如果是用(yòng)戶直接強行退出程序,自然也(yě)沒有後續進程可(kě)言,但也(yě)許可(kě)以考慮到,當用(yòng)戶重新啓動該功能時(shí),設備是否可(kě)以自動詢問:“上次我們還(hái)有一個(gè)任務沒有完成,是XXX,是否将其繼續完成”。
但如果是用(yòng)戶停止了(le)任務,比如用(yòng)戶說“給我定個(gè)鬧鐘(zhōng)”,但就在設備詢問“要定幾點?”的(de)時(shí)候,用(yòng)戶說“算(suàn)了(le),不用(yòng)了(le)”,那這(zhè)個(gè)時(shí)候,設備應該如何回複。
因此在這(zhè)一環節主要考慮的(de)就是當一場(chǎng)“任務型對(duì)話(huà)”結束時(shí),設備可(kě)以執行怎樣的(de)一個(gè)操作,來(lái)反饋給用(yòng)戶。