下载
登录/ 注册
主页
论坛
视频
热股
可转债
下载
下载

讯飞,这次是真的狼来了吗?

12-11-10 15:41 2988次浏览
hhtt2161
+关注
博主要求身份验证
登录用户ID:
本文来源:创事记 作者:冰岩

微软逆天的计算机“同声传译”,直接用本人声音说中文

  微软昨天发布了一段很有意思的视频,视频中,微软首席研究官瑞克?拉希德(Rick Rashid)解释并演示了一些关于计算机语音识别方面的重大进展,这些进展有助于机器更好地理解他用英语说的话,这些话同时被计算机自动转录下来。接着,他演示了如何将这些英语立即翻译成普通话,同时保持了自己的语音语调,听起来像自己说的一样。

  微软逆天的计算机“同声传译”,亮点从7分20秒开始 媒体来源:创事记

  有趣之处在于,微软公司表示通过对大量数据的深入分析,已经有能力将英文转换成普通话的发音说出来,当视频中的瑞克对该系统讲了大约1小时左右的英语以后,系统就可以用他的语音语调说普通话了。

  微软介绍说,实现这项技术的工作流程大概是:首先程序需要识别说话者所使用的语言;然后将这些语言转换;最后再一次性的翻译,并使用另一种语言输出,同时可以保留个人声音的特点,这样就使得输出的声音不再是自动合成的效果。

  虽然这项技术的细节令人难以理解,不过作为微软研究院负责人的瑞克透漏了一些信息,他说道:“大概在两年前,微软研究院和多伦多大学的研究人员们取得了一项突破,利用模拟人脑行为的‘深度神经网络(Deep Neural Networks)’技术,能让语音识别器更具辨别能力,其性能优于以往的方法。通过这种技术,我们让语音识别的错词率比以往的方法降低了30%,也就是说以前每4到5个词里面便有一个是错误的,而现在每7到8个词里才错1个。”

  现阶段,用户使用前大概需要1个小时的语音输入时间,以让系统辨别每个人声音中的细微差别,同时建立相应的模型。此外,该项目已经能够支持包括普通话在内的26种语言,相信该技术在实时口译工具,语言学工具等方面会有广阔的应用前景。

 
打开淘股吧APP
2
评论(15)
收藏
展开
热门 最新
hhtt2161

12-11-26 20:07

0
又杀出一个:

Siri迎来中国挑战 搜狗语音助手发布

不知道搜狗语音的核心技术是自己的还是讯飞的。
九三

12-11-14 19:33

0
英译汉和汉译英根本不是一回事
譬如说下面这么一句[南京市长江大桥],微软是把它理解成[南京市-长江大桥]来翻译还是[南京市长-江大桥]来翻译呢。
hhtt2161

12-11-14 19:13

0
微软实时语音翻译软件已具雏形 可互译26种语言
正文 我来说两句(3人参与) 2012年03月13日18:35 来源:搜狐IT 

【搜狐IT消息】北京时间3月13日消息,微软研究院正在开发一款语音翻译软件,它能将用户说的话翻译成其他语言播放出来,同时保留用户本身的口音、音色和语调,听上去就像用户亲口说出来的一样。

  微软首席研究官瑞克?拉希德(Rick Rashid)在一段视频中演示了这款软件的雏形:他说了一句很长的英语,然后他的话被分别翻译成西班牙语、意大利语和中文普通话,尽管音质能听出一些数字处理的痕迹,但听起来依然很像拉希德本人。

  在使用该语音翻译软件之前,用户需花费约1小时时间对它进行训练——也就是为自己的语音建模。建模完成后,用户的语音数据会与微软的“标准文字-语音模型”融为一体,用于对目标语言进行翻译。该软件的创建者宋歌平(Frank Soong)介绍称,这一方法可以实现26种语言之间的互译,涵盖了世界上使用者人数位居前列的大多数重要语言。

  虽然该软件尚未应用到现实生活中,但是一旦它有朝一日登陆智能手机并借助微软Azure等云服务,就完全有可能通过近乎实时的翻译让语言不通的人实现语音交流。也许有一天,未来的微软Windows操作系统也会配备这一软件。

  具有这种实时语音翻译功能的设备不但是未来跨国旅行者的掌中法宝,也非常有助于促进不同语言文化之间的交流,以及保留那些使用者较少、正受到英语等大语种冲击的小语种。(悠拉)
hhtt2161

12-11-14 19:11

0
讯飞的投资者关系的确做的很好,这么快就回答了投资者的疑问。
思考一个问题:“只是一次精心准备的前瞻技术的演示,离实用还有非常大的距离”,离实用这个距离有多大?

微软实时语音翻译软件已具雏形 可互译26种语言
2012年03月13日18:35 来源:搜狐IT  

微软从雏形到11月的这个演示视频仅8个月。到实用会很远吗?

投资者是否可再问讯飞一个问题:讯飞已完全掌握深度神经网络技术,是否可以也精心准备前瞻技术的演示:说中文出英文。
九三

12-11-13 17:48

0
科大讯飞
002230   您好,祝贺里克博士成功的演示。但从技术上评价,这只是一次精心准备的前瞻技术的演示,离实用还有非常大的距离。讯飞公司早在2010年几乎与微软同步已启动了DBN(Deep Belief Network深度神经网络)技术的跟踪、研究和应用,并已完全掌握相关技术。
hhtt2161

12-11-11 19:31

0
这不是故事,是事实,微软首席研究官演示的视频网网上多的是。

微软这个出来后小飞的走势就仁者见仁智者见智了。
八段

12-11-11 19:18

0
无论他拥有怎样的技术,大的回撤已在眼前~!有票的别傻等了!
hhtt2161

12-11-11 18:28

0
[引用原文已无法访问]
我也希望是杞人忧天,,但作为外行又不可不防。
深度神经网络(Deep Neural Networks)’技术,能让语音识别器更具辨别能力,其性能优于以往的方法。
这是关键,如果这一技术比讯飞的强,还是小心为妙。讯飞很早有说中文到出英文的想法,现在微软已先出成品。
科技替代的风险不得不防。
kevinqin008

12-11-10 21:24

0
完全不同的东西,英语识别加翻译,并非中文识别。
况且SIRI出现都没影响,微软算个屁,中国不能在中文识别上树立自己的标准就别谈创新了,其他更没戏。
yifanfs

12-11-10 19:55

0
里面都是基金在乱搞
刷新 首页上一页 下一页 末页
提交