语音生成技术旨在让机器像人一般“自然”发声。据测试,谷歌麾下的DeepMind将机器生成的语音与人声的品质差距缩小了一半。 英国《金融时报》 理查德-沃特斯 旧金山报道 谷歌旗下的DeepMind称,在计算机语音生成领域取得巨大飞跃。这一技术进步可能会令机器像人一样“自然”发声的一天提前到来。 这家总部驻英国的人工智能分公司的研究人员表示,由人类听众对其系统的测试(尽管这种测试不可避免地带有主观性)显示,该技术将目前计算机系统与人类说话间存在的质量差距缩小了一半。 一位知情人士表示,这一名叫WaveNet的系统尚未被用于谷歌任何产品。该技术在生成语音时需要极大的运算能力,令它在可预期的未来无法实际运用到“真实世界”。 周四,WaveNet相关研究以及一系列该系统生成的语音样本被发布到网上。在近期人工智能方面的角逐中,电脑语音生成受到的关注,不如被称为“自然语言识别”的语言理解领域。 DeepMind研究人员表示:“让人可以和机器交谈,是人机互动领域的长期梦想。”DeepMind表示,通过对声波建模,该公司可生成模仿任何人声音的语音。DeepMind还曾用音乐测试过该系统,让它根据对经典音乐的分析,创作短小的钢琴片段。 由DeepMind研制的系统今年打败了全球顶级围棋选手,从而令该公司赢得广泛关注。对于如何将该公司的人工智能技术用于谷歌的业务,谷歌一直秘而不宣,只表示该技术将谷歌数据中心所需电力减少了40%,并曾“大幅改善从YouTube、Google Play到谷歌广告产品的一系列服务”。 |
HOT NEWS
FOCUS NEWS