哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

20多年專注語音合成芯片公司分享:TTS芯片端是如何達(dá)到100%精準(zhǔn)合成的

智能語音 ? 來源:智能語音 ? 作者:智能語音 ? 2024-05-06 15:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我國漢字文化博大精深,雖然現(xiàn)在語音合成技術(shù)發(fā)展較為成熟,但仍無法做到100%的智能分析和識別,來滿足人們的需求習(xí)慣。
例如漢字“一”,在不同語境下有3種讀法,“一五一十”“一路平安”“一言為定”,大家可以讀讀看。
再例如數(shù)字“1”,電話號碼“010-62986600、15321801789”,日期“2018-01-01”,在電話號碼中大家習(xí)慣讀成“幺”,而在日期里又習(xí)慣性的讀成“一”。
這樣的場景還有很多很多,本文將向大家介紹在TTS芯片端,如遇到無法智能識別播報的情況下,利用“文本控制標(biāo)記”,使文本合成準(zhǔn)確率達(dá)到100%的。
我們以市場常見的TTS語音芯片VTX316為例,它支持10多種文本控制標(biāo)記,下面我們一一列舉,并加以說明。
控制標(biāo)記統(tǒng)一格式為“[XX]”,“XX”=標(biāo)記參數(shù),使用時只要將標(biāo)記放在需要調(diào)整的文本前即可。

1. 數(shù)字處理標(biāo)記[nX]

默認(rèn)設(shè)置下芯片會自動識別數(shù)字的含義,是按“號碼方式" OR "數(shù)值方式"進(jìn)行解讀
備注:“X”=0、1、2
[n0]=自動判斷
[n1]=按號碼方式
[n2]=按數(shù)值方式
舉例文本1:撥打62986600。有123公斤重。
說明:“62986600”會讀作“六二九八六六零零”?!?23”讀作“一百二十三”
舉例文本2:[n2]撥打62986600。[n1]有123公斤重。
說明:“62986600”會讀作“六千二百九十八萬六千六百”?!?23”讀作“一二三”

2. 數(shù)字“1”的處理標(biāo)記[yX]

默認(rèn)設(shè)置下芯片會自動識別數(shù)字"1"的讀法,是讀“幺" OR "一"進(jìn)行解讀
備注:“X”=0、1
[y0]=讀成“幺”
[y1]=讀成“一”
舉例文本1:[y0]撥打010-62986600
說明:讀作“撥打零幺零,六二九八六六零零”
舉例文本2:[y1]撥打010-62986600
說明:讀作“撥打零一零,六二九八六六零零”

3. 標(biāo)點符號處理標(biāo)記[bX]

默認(rèn)情況下標(biāo)點符號的名稱是不進(jìn)行播報的
備注:“X”=0、1
[b0]=不播報標(biāo)點符號
[b1]=播報標(biāo)點符號
舉例文本:[b1]歡迎光臨,請進(jìn)!
說明:讀作“歡迎光臨 逗號 請進(jìn) 感嘆號”

4. 改變漢字讀音標(biāo)記[=X]

當(dāng)我們想改變原來漢字的讀音時可以用到這個標(biāo)記策略,比如更換一個字的發(fā)音或是多音字”
備注:“X”=要改變的讀音,格式為“漢語拼音”+“聲調(diào)”,聲調(diào)=1、2、3、4、5(輕聲)
舉例文本1:歡迎他們,歡迎他[=ni3]們,歡迎他[=wo3]們
說明:讀作“歡迎他們,歡迎你們,歡迎我們”
舉例文本2:解[=xie4]放濤用語音合成芯片,單位的單[=shan4]小虎也在用
說明:“解”會讀成“謝”,“單”會讀成“善”

5. 發(fā)音人設(shè)置標(biāo)記[mX]

VTX316TTS芯片支持8種發(fā)音人(音色),可通過[mX]標(biāo)記隨意切換。
備注:“X”=3、51、52、53、54、55、56、57,對應(yīng)的發(fā)音人如下
[m3]=曉玲,女聲(默認(rèn)設(shè)置)
[m51]=尹小堅,男聲
[m52]=易小強(qiáng),男聲
[m53]=田蓓蓓,女聲
[m54]=唐老鴨,卡通聲
[m55]=小燕子,女童聲
[m56]=貝童,男童聲
[m57]=曉可,男童聲
舉例文本:[m3]你好,[m54]這是發(fā)音人設(shè)置的舉例。
說明:“你好”的發(fā)音人為女聲曉玲,“這是發(fā)音人設(shè)置的舉例”的發(fā)音人是卡通聲唐老鴨

6. 語速調(diào)節(jié)標(biāo)記[sX]

TTS芯片支持30級語速調(diào)節(jié)
備注:“X”=0~30,默認(rèn)設(shè)置為5,數(shù)值越大語速越快
舉例文本:歡迎使用[s10]宇音天下語音合成芯片
說明:“歡迎使用”的語速為5級,“宇音天下語音合成芯片”的語速為10級

7. 語調(diào)調(diào)節(jié)標(biāo)記[tX]

語音合成芯片可控制10級語調(diào)調(diào)整
備注:“X”=0~10,數(shù)值越大語調(diào)越高
舉例文本:歡迎使用[t8]宇音天下語音合成芯片
說明:“歡迎使用”的語調(diào)為5級,“宇音天下語音合成芯片”的語調(diào)為8級

8. 音量調(diào)節(jié)標(biāo)記[vX]

TTS語音芯片支持10級音量調(diào)整
備注:“X”=0~10,數(shù)值越大音量越大
舉例文本:歡迎使用[v8]宇音天下語音合成芯片
說明:“歡迎使用”的音量為5級,“宇音天下語音合成芯片”的音量為8級

9. 提示音處理標(biāo)記[xX]

語音合成芯片通常內(nèi)置多首提示音,例如"sound901",具體格式參芯片數(shù)據(jù)手冊。
備注:"X"=0、1
[x0]=不按提示音處理
[x1]=按提示音處理
舉例文本:[x0]sound901
說明:讀作“sound901”,會按照字母加數(shù)字的讀法播報

10. 中文拼音識別標(biāo)記[iX]

判斷是否將文本識別成拼音
備注:“X”=0、1
[x0]=不識別漢語拼音
[x1]=識別成拼音
舉例文本:[i1]歡迎shi3yong4宇yin1tian1xia4[i0]語音合cheng2系統(tǒng)
說明:讀作“歡迎使用宇音天下語音合cheng2系統(tǒng)”,“cheng2”會按照字母和數(shù)字逐字播報

11. 停頓(靜音)時間標(biāo)記[pX]

在有需要停頓的文本中插入該標(biāo)記,可靈活控制停頓時間
備注:“X”=停頓時間,單位毫秒(ms)
舉例文本:歡迎使用[p800]宇音天下[p350]TTS語音芯片
說明:播報“歡迎使用”后,停頓800毫秒,播報“宇音天下”,停頓350毫秒,播報“TTS語音芯片”

12. 恢復(fù)默認(rèn)合成參數(shù)標(biāo)記[d]

本參數(shù)標(biāo)記將合成參數(shù)恢復(fù)成默認(rèn)設(shè)置,除發(fā)音人標(biāo)記參數(shù)
舉例文本:[n1]123,[y1]010-62986600[d]123, 010-62986600
說明:讀作“一二三,零一零,六二九八六六零零,一百二十三,零幺零,六二九八六六零零”

經(jīng)過上面的介紹,在語音合成芯片端如何達(dá)到100%的準(zhǔn)確率,各位的思路是否已經(jīng)非常清晰了呢?

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54428

    瀏覽量

    469346
  • TTS
    TTS
    +關(guān)注

    關(guān)注

    0

    文章

    66

    瀏覽量

    11591
  • 語音合成芯片
    +關(guān)注

    關(guān)注

    0

    文章

    29

    瀏覽量

    7854
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    TTS語音芯片究竟是什么?工作原理、應(yīng)用及廠家選型全解析

    一、什么是TTS語音芯片?它是如何工作的?TTS語音芯片,全稱“文本轉(zhuǎn)
    的頭像 發(fā)表于 04-15 08:38 ?158次閱讀
    <b class='flag-5'>TTS</b><b class='flag-5'>語音</b><b class='flag-5'>芯片</b>究竟是什么?工作原理、應(yīng)用及廠家選型全解析

    國產(chǎn)TTS芯片哪家強(qiáng)?從參數(shù)到實測的真實評價

    國產(chǎn)語音合成芯片這幾年發(fā)展很快,市面上可選的型號越來越多。但大多數(shù)資料要么是廠商自己的宣傳,要么是簡單羅列參數(shù),很少有人從工程實用角度說清楚"到底好不好用"。這篇文章基于實際開發(fā)
    的頭像 發(fā)表于 04-03 11:22 ?352次閱讀
    國產(chǎn)<b class='flag-5'>TTS</b><b class='flag-5'>芯片</b>哪家強(qiáng)?從參數(shù)到實測的真實評價

    語音識別芯片介紹,語音識別芯片工作原理解析

    在智能交互不斷深入的今天,語音識別芯片正成為眾多設(shè)備實現(xiàn)語音控制與AI對話的關(guān)鍵部件。語音芯片廣義上涵蓋
    的頭像 發(fā)表于 04-01 16:26 ?214次閱讀

    TTS文字轉(zhuǎn)語音芯片選型指南:串口驅(qū)動、音質(zhì)、功耗一次說清

    嵌入式產(chǎn)品開發(fā)語音播報功能,看起來是個不起眼的小功能,但選型的時候如果沒選對,后期會增加很多麻煩。這篇文章從三個最關(guān)鍵的角度——串口驅(qū)動方式、音質(zhì)、功耗分析,把TTS芯片選型的關(guān)鍵點說清楚。一、串口
    的頭像 發(fā)表于 03-30 17:05 ?476次閱讀
    <b class='flag-5'>TTS</b>文字轉(zhuǎn)<b class='flag-5'>語音</b><b class='flag-5'>芯片</b>選型指南:串口驅(qū)動、音質(zhì)、功耗一次說清

    TTS語音合成芯片怎么選?2026年主流方案橫向?qū)Ρ?/a>

    跑軟件合成……到底該怎么選?這篇文章從實際工程角度出發(fā),梳理2025年主流TTS語音合成芯片方案,給出橫向?qū)Ρ群瓦x型建議。先搞清楚你要解決的
    的頭像 發(fā)表于 03-26 15:21 ?680次閱讀
    <b class='flag-5'>TTS</b><b class='flag-5'>語音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>怎么選?2026年主流方案橫向?qū)Ρ? />    </a>
</div>                              <div   id=

    4路TTS語音播報控制器:聯(lián)動控制,音頻定時播放

    4路TTS語音播報控制器是一種能夠?qū)⑽谋拘畔⑥D(zhuǎn)換為語音并進(jìn)行播報的電子設(shè)備,具備4路相關(guān)控制功能。 通過語音合成技術(shù),將輸入的文字自動
    的頭像 發(fā)表于 10-31 15:44 ?607次閱讀

    語音報警器:TTS語音播報,云平臺邏輯自控

    TTS語音播報報警器是一種集成了傳統(tǒng)報警器和TTS(文本轉(zhuǎn)語音)技術(shù)的智能設(shè)備。清晰、準(zhǔn)確地用人類語言播報報警原因、位置、狀態(tài)等具體信息。 工作原理 文本
    的頭像 發(fā)表于 10-29 16:31 ?980次閱讀

    ?CDCDLP223 時鐘合成器技術(shù)文檔總結(jié)

    CDCDLP223是一款基于PLL的高性能時鐘合成器,針對DLP?系統(tǒng)進(jìn)行了優(yōu)化。它使用20 MHz晶體生成基頻,并導(dǎo)出100 MHz HCLK和300 MHz HCLK輸出的頻率。此外,該CDCDLP223在
    的頭像 發(fā)表于 09-19 10:48 ?900次閱讀
    ?CDCDLP223 時鐘<b class='flag-5'>合成</b>器技術(shù)文檔總結(jié)

    基于開源鴻蒙的語音識別及語音合成應(yīng)用開發(fā)樣例

    本期內(nèi)容由AI Model SIG提供,介紹了在開源鴻蒙中,利用sherpa_onnx開源三方庫進(jìn)行ASR語音識別與TTS語音合成應(yīng)用開發(fā)的流程。
    的頭像 發(fā)表于 08-25 14:26 ?4447次閱讀
    基于開源鴻蒙的<b class='flag-5'>語音</b>識別及<b class='flag-5'>語音</b><b class='flag-5'>合成</b>應(yīng)用開發(fā)樣例

    TTS文字合成語音芯片的使用場景

    TTS文字合成語音播報芯片的使用場景非常廣泛,可以適用于各行各業(yè),主要應(yīng)用于復(fù)雜的語音播報場景,下面小編帶大家一起來了解一下。 傳統(tǒng)的語音
    的頭像 發(fā)表于 08-22 17:11 ?1158次閱讀

    開源TTS應(yīng)用:打破技術(shù)壟斷,讓語音合成成為每個人的創(chuàng)造力工具

    傳統(tǒng)語音合成技術(shù)往往被巨頭壟斷,成本高且定制難。開源TTS應(yīng)用的誕生,徹底改變游戲規(guī)則。其開放源代碼讓中小企業(yè)、個人開發(fā)者乃至普通用戶都能低成本接入并改造語音技術(shù),將
    的頭像 發(fā)表于 08-15 14:03 ?733次閱讀
    開源<b class='flag-5'>TTS</b>應(yīng)用:打破技術(shù)壟斷,讓<b class='flag-5'>語音</b><b class='flag-5'>合成</b>成為每個人的創(chuàng)造力工具

    一顆TTS語音芯給產(chǎn)品增加智能語音播報能力

    一顆TTS語音芯片給產(chǎn)品增加智能語音播報能力 傳統(tǒng)語音播報芯片可以設(shè)置一些固定的
    的頭像 發(fā)表于 08-14 16:33 ?876次閱讀

    從開發(fā)工程師視角看TTS語音合成芯片

    從開發(fā)工程師視角看TTS語音合成芯片語音交互領(lǐng)域,TTS
    的頭像 發(fā)表于 08-13 14:52 ?959次閱讀

    Air8000 TTS開源,語音合成從此“零距離”!

    技術(shù)不應(yīng)有圍墻,創(chuàng)新需要共生長。Air8000宣布TTS應(yīng)用源代碼全面開放,開發(fā)者可自由定制語音風(fēng)格、優(yōu)化合成效果,讓文字與聲音的對話,不再受限于黑箱算法。 TTS (Text-to-
    的頭像 發(fā)表于 07-03 16:33 ?733次閱讀
    Air8000 <b class='flag-5'>TTS</b>開源,<b class='flag-5'>語音</b><b class='flag-5'>合成</b>從此“零距離”!

    從代碼到聲音,Air8000 TTS開源應(yīng)用開啟創(chuàng)作新紀(jì)元!

    Air8000顛覆傳統(tǒng)TTS開發(fā)模式,以開源之力重塑語音合成領(lǐng)域!獲取應(yīng)用源碼,開發(fā)者即可自由修改參數(shù)、適配多場景,讓文字與聲音的結(jié)合,迸發(fā)無限創(chuàng)意價值。 TTS (Text-to-S
    的頭像 發(fā)表于 06-27 17:06 ?666次閱讀
    從代碼到聲音,Air8000 <b class='flag-5'>TTS</b>開源應(yīng)用開啟創(chuàng)作新紀(jì)元!
    利津县| 四会市| 治县。| 泽库县| 巴彦县| 松桃| 沭阳县| 云阳县| 景洪市| 曲沃县| 方正县| 宣武区| 莱芜市| 千阳县| 陕西省| 英吉沙县| 彭泽县| 龙南县| 弋阳县| 南康市| 道真| 大姚县| 新余市| 马边| 廉江市| 临桂县| 新邵县| 即墨市| 新营市| 江达县| 桂东县| 铅山县| 秦安县| 汉寿县| 赣榆县| 花莲市| 滕州市| 盐津县| 鲁山县| 垣曲县| 平凉市|