摘要:11月28日,深圳地鐵12號(hào)線正式開(kāi)通!此次項(xiàng)目中,科大訊飛攜手達(dá)實(shí)智能與深圳地鐵深度合作,打造了一系列智慧化的應(yīng)用場(chǎng)景。1、多模語(yǔ)音增...
11月28日,深圳地鐵12號(hào)線正式開(kāi)通!此次項(xiàng)目中,科大訊飛攜手達(dá)實(shí)智能與深圳地鐵深度合作,打造了一系列智慧化的應(yīng)用場(chǎng)景。
1、多模語(yǔ)音增強(qiáng)技術(shù)率先用于深圳地鐵語(yǔ)音購(gòu)票
該項(xiàng)目智慧客服中心采用AI數(shù)字客服為乘客提供語(yǔ)音交互服務(wù),可讓乘客通過(guò)語(yǔ)音交互自助完成信息查詢、車(chē)票購(gòu)買(mǎi)。在過(guò)去因?yàn)榈罔F站點(diǎn)太多,乘客在售票機(jī)買(mǎi)票時(shí)很難快速找到要去的站點(diǎn),而這對(duì)于不太會(huì)操作設(shè)備的老年人來(lái)說(shuō)更是難上加難,一堆站點(diǎn)看花了眼。這些問(wèn)題在加上語(yǔ)音購(gòu)票的功能后迎刃而解,乘客只要說(shuō)出想去哪里即可買(mǎi)票,大幅提升了乘客的購(gòu)票體驗(yàn)。

深圳12號(hào)線智慧客服終端
在地鐵站人聲嘈雜的場(chǎng)景下,使用語(yǔ)音進(jìn)行購(gòu)票理論上交互體驗(yàn)并不好。以往常規(guī)方案受周邊雜聲影響較大,語(yǔ)音識(shí)別準(zhǔn)確率相對(duì)較低,經(jīng)常出現(xiàn)“答非所問(wèn)”的情況。而在深圳地鐵12號(hào)線智能售票機(jī)及智慧客服終端上,率先采用了科大訊飛最新發(fā)布的多模語(yǔ)音增強(qiáng)技術(shù),該技術(shù)通過(guò)人臉唇形等多模信息的使用,能有效的抑制地鐵環(huán)境噪音和后排說(shuō)話人聲,讓嘈雜環(huán)境下機(jī)器的語(yǔ)音識(shí)別準(zhǔn)確率大大提高,避免了語(yǔ)音交互時(shí)被旁邊人說(shuō)話帶“跑偏”的尷尬,有效提升了嘈雜環(huán)境下的語(yǔ)音交互體驗(yàn)。在科大訊飛多模態(tài)語(yǔ)音識(shí)別技術(shù)的加持下,12號(hào)線地鐵購(gòu)票的體驗(yàn)提升顯著,受到了很多乘客的好評(píng)。

科大訊飛多模態(tài)語(yǔ)音識(shí)別技術(shù)
2、從單模態(tài)到多模態(tài),科大訊飛持續(xù)向新
人類(lèi)通過(guò)眼、耳、鼻、舌等多個(gè)器官同時(shí)感知世界,而機(jī)器若想更自然地與人類(lèi)交流,當(dāng)然也需要通過(guò)多模態(tài)感知。多模語(yǔ)音增強(qiáng)技術(shù),作為科大訊飛新推出的解決公共場(chǎng)景下語(yǔ)音交互難題的最新技術(shù),打破以往純聲學(xué)降噪的方式,將機(jī)器視覺(jué)也融合到環(huán)境降噪技術(shù)中,使其能夠在多人同時(shí)說(shuō)話的嘈雜場(chǎng)景中,將其他人聲和環(huán)境噪聲進(jìn)行過(guò)濾,準(zhǔn)確地把目標(biāo)說(shuō)話人的聲音分離出來(lái)進(jìn)行識(shí)別。通過(guò)這種單模到多模的技術(shù)創(chuàng)新,使得在同方向有人說(shuō)話干擾的場(chǎng)景下,多模語(yǔ)音增強(qiáng)技術(shù)的識(shí)別準(zhǔn)確率對(duì)比傳統(tǒng)語(yǔ)音識(shí)別技術(shù)相對(duì)提升70%以上。它不僅讓設(shè)備能聽(tīng)見(jiàn),還能看見(jiàn)你說(shuō)話,就像武俠小說(shuō)中的“讀唇術(shù)”一樣,知道你在說(shuō)什么。

3、訊飛AIUI開(kāi)放平臺(tái),致力AI技術(shù)落地更多場(chǎng)景
事實(shí)上,地鐵智能售票機(jī)及智慧客服終端僅是科大訊飛AIUI開(kāi)放平臺(tái)支持合作伙伴打造的項(xiàng)目之一,平臺(tái)開(kāi)放的多模語(yǔ)音增強(qiáng)技術(shù)在醫(yī)療自助機(jī)、銀行柜員機(jī)、取款機(jī)以及商用服務(wù)機(jī)器人等項(xiàng)目上也有相似的應(yīng)用場(chǎng)景。在人聲嘈雜的公共場(chǎng)所,通過(guò)多模態(tài)語(yǔ)音技術(shù)均可有效降低環(huán)境噪音的干擾,提高語(yǔ)音識(shí)別準(zhǔn)確率,保障用戶的對(duì)話交互體驗(yàn)。
截止目前,訊飛開(kāi)放平臺(tái)已開(kāi)放545項(xiàng)AI產(chǎn)品及能力,聚集超過(guò)380.5萬(wàn)開(kāi)發(fā)者團(tuán)隊(duì),總應(yīng)用數(shù)超過(guò)159.5萬(wàn),累計(jì)覆蓋終端設(shè)備數(shù)超過(guò)37.0億,AI大學(xué)堂學(xué)員總量達(dá)到71.7萬(wàn),鏈接超過(guò)500萬(wàn)生態(tài)伙伴 ,以科大訊飛為中心的人工智能產(chǎn)業(yè)生態(tài)持續(xù)構(gòu)建。未來(lái)AIUI作為訊飛人機(jī)交互的開(kāi)放平臺(tái),將通過(guò)更多AI技術(shù)賦能合作伙伴,在更多的場(chǎng)景落地多模態(tài)語(yǔ)音增強(qiáng)技術(shù),為客戶創(chuàng)造價(jià)值,也為用戶帶來(lái)更多新的體驗(yàn)。