首页 » 排名链接 » 文本转语音-我的AI开发历程(三)(开发多音字语音软件读音)

文本转语音-我的AI开发历程(三)(开发多音字语音软件读音)

落叶飘零 2024-11-25 11:33:12 0

扫一扫用手机浏览

文章目录 [+]

第一个问题,是开发手机端的,还是开发电脑端的。
因为我最终目的是想将文本转换为音频,象听音乐一样听小说,开发出的软件只是作为一个转换工具,不是时刻在应用。
而手机端的软件通常是打开即应用。
因此还是决定开发电脑端的。

第二个问题,是利用现成的文字转语音的接口SDK或API工具,还是独自开发。
国内语音技术最好的公司是讯飞,该公司的SDK开发包是收费的,我开发的软件是自娱自乐,又不面向市场,因此没必要花钱去购买开发包。
于是决定自己开发。

现在网站大多都提供语音朗读功能,虽然读得都非常流畅,但如果仔细听的话也会发现一些错误,主要错误就是多音字问题。
有些字与不同的字组成词时,发音是不同的,甚至在不同的语境中发音也是不同的。
如“地”字,可以读dì,也可以读de,如“重重”,可以读chóng chóng,也可以读zhòng zhòng。
如“宜兴是无锡的一块飞地(dì)”,“他吃惊地(de)端起了酒杯”,“他好像进入重重(chóng chóng)迷雾之中”,“他重重(zhòng zhòng)地摔在了地板上”。
关键是要分析何时读一个音,何时又读另一个音。

文本转语音-我的AI开发历程(三)(开发多音字语音软件读音) 排名链接
(图片来自网络侵删)

据统计,《新华字典》中所列多音字有600多个,个别字的读音能多达5个。
不同的读音表义不同,用法有差异,词性也不同。

第三个问题,就是上面所说的多音字问题,可以说我通过分析这个问题,决定了我开发文字转语音软件的基本思路。

高尔基的《海燕》

标签:

相关文章

程序流程语言,未来编程的基石

随着信息技术的飞速发展,编程语言已经成为现代社会不可或缺的一部分。而程序流程语言,作为编程语言的重要组成部分,更是承载着未来编程的...

排名链接 2024-12-31 阅读0 评论0

零与一,C语言中的基石与哲学

在浩瀚的计算机科学领域,C语言以其简洁、高效、可移植等特性,被誉为程序员的“启蒙语言”。而在这门语言中,零与一作为最基本的数据元素...

排名链接 2024-12-31 阅读1 评论0

语言识别工具的革命,重塑沟通的未来

在人类历史的长河中,语言一直是沟通的桥梁,连接着不同的文化和个体。随着科技的飞速发展,一种新的工具——语言识别工具,正在悄然改变着...

排名链接 2024-12-31 阅读1 评论0

语言学博客,探索语言奥秘,解码人类文明

语言学,作为一门研究人类语言的学科,自古以来就备受关注。从古代的《诗经》到现代的网络语言,语言一直是人类沟通、交流、传承文化的重要...

排名链接 2024-12-31 阅读1 评论0