第一个问题,是开发手机端的,还是开发电脑端的。因为我最终目的是想将文本转换为音频,象听音乐一样听小说,开发出的软件只是作为一个转换工具,不是时刻在应用。而手机端的软件通常是打开即应用。因此还是决定开发电脑端的。
第二个问题,是利用现成的文字转语音的接口SDK或API工具,还是独自开发。国内语音技术最好的公司是讯飞,该公司的SDK开发包是收费的,我开发的软件是自娱自乐,又不面向市场,因此没必要花钱去购买开发包。于是决定自己开发。
现在网站大多都提供语音朗读功能,虽然读得都非常流畅,但如果仔细听的话也会发现一些错误,主要错误就是多音字问题。有些字与不同的字组成词时,发音是不同的,甚至在不同的语境中发音也是不同的。如“地”字,可以读dì,也可以读de,如“重重”,可以读chóng chóng,也可以读zhòng zhòng。如“宜兴是无锡的一块飞地(dì)”,“他吃惊地(de)端起了酒杯”,“他好像进入重重(chóng chóng)迷雾之中”,“他重重(zhòng zhòng)地摔在了地板上”。关键是要分析何时读一个音,何时又读另一个音。

据统计,《新华字典》中所列多音字有600多个,个别字的读音能多达5个。不同的读音表义不同,用法有差异,词性也不同。
第三个问题,就是上面所说的多音字问题,可以说我通过分析这个问题,决定了我开发文字转语音软件的基本思路。
高尔基的《海燕》