0
电视读报 为用户打造专属读报人
电视读报是将报纸上的新闻信息选取或整理,通过电视媒体,利用人类最自然、最直接的语言沟通方式,将抽象化的报纸内容生动自然的传达给观众。基于全球领先的智能语音技术,科大讯飞近期联合机顶盒中间件厂商,推出了电视读报业务,将报纸上的内容,利用语音技术朗读给您听,打造专属于您的电视读报人。
近年来电视读报已经成为众多观众喜闻乐见的节目形式,中央台的《马斌读报》,凤凰卫视的《有报天天读》可谓家喻户晓。但这些节目读的报纸信息有限,读报的时间固定,而我们生活在信息爆炸的年代,我们需要获得的信息远不及此,播放时间固定,也导致很难如时收看。而以智能语音技术结合机顶盒实现的电视读报正是解决以上问题,满足人们信息需求的最佳途径。
科大讯飞公司的智能语音合成技术,能够将任意文字信息转化为清晰流畅的语音输出,目前与机顶盒中间件厂商合作推出的电视读报,只要您拥有支持该业务的机顶盒,您就可以随时通过电视收听新闻内容,想听什么就听什么,完全不受限制。用户还可以选择不同的发音风格为自己读报,如男声、女声,老人、中年人、小孩,粤语、四川话等。同时数字报纸的信息量非常的大,全国各地各类型的报纸、甚至英文报纸,讯飞语音都可以有声有色的朗读。
随着全国数字电视的普及,数字报纸业务得到迅猛的发展,相较于传统的纸质报纸,数字报纸具有信息量大、检索方便、成本低、环保无垃圾等诸多特色,但电视毕竟不是电脑,远距离的长时间看报还是不够方便,通过讯飞的智能语音技术,变“看”报为“听”报,让用户可以更充分的享受数字报纸和电视读报双重优越性的完美结合,势必得到越来越多用户的青睐。
科大讯飞全球领先的智能语音技术带来了全新的信息获取方式。应用了讯飞语音技术的电视读报,在为用户打造专属读报人外,还为数字电视的综合服务增添了特色和亮点。
0
转自:《音响改装技术》杂志
Editor/白水
感谢科大讯飞提供信息支持
题记:中国汽车保有量迅速增加,中国导航设备普及率近年来虽持续快速增加,但相对于汽车总保有量来说,比例依然很低,远低于欧美25%、日本59%的普及率,发展空间极大。中国地大物博、交通情况复杂的特点也决定了导航设备在中国的应用更具必要性与现实意义,且中国导航产品具有突出的性价比优势。语音技术与导航设备的结合是大势所趋,既是用户实际需求,又是导航产品的必然发展方向,市场空间极为广阔。那么什么是语音技术?语音技术的发展现状怎样?它到底是如何与导航产品结合的?它将给未来的汽车带来哪些价值?
语音导航国际发展趋势
从全球汽车产业发展状况来看,语音技术在车载导航中的应用是一种新的趋势。传统的车载导航产品,是用眼睛看的方式获取相关信息,对汽车驾驶者而言存在一定的安全隐患。因此,基于广大汽车驾驶者安全性、舒适性考虑,将语音技术应用于导航领域是必然趋势。
语音技术在车载导航中的应用已成为国际汽车发展的必然趋势,这将真正实现人机语音交互。目前,雷克萨斯采用了来自Voice Box Technologies公司的语音识别(VR)解决方案。奥迪也正在专注于改善其语音识别,并推出了新的升级版软件来更新其MMI,使其变得更加用户友好。同时,更多整车厂也在为车载导航产品积极寻求适合的语音技术解决方案。
国际上每年都有举办“Blizzard Challenge”比赛,它是国际英文语音合成研发领域最高级别的赛事,参赛单位包括中国的科大讯飞、美国麻省理工学院(MIT)、卡耐基-梅隆大学(CMU)、IBM 研究院、微软研究院、英国爱丁堡大学、日本ATR(国际电气通信基础技术研究所)等国际一流的语音研究机构,在一起既同场竞技,又共同交流技术。
在不远的将来,语音车载导航技术的以及整车语音技术的应用水平,将成为衡量高端车型的一个重要标准。在更长远的时间里,语音技术在汽车上的应用将更为普遍,成为汽车的一项基本配置和功能。
语音导航国内发展状况
目前,国内汽车制造厂商就语音技术在车载导航中的应用已经达成了广泛的共识,都在积极寻求语音技术提供商。与此同时,汽车制造厂商在寻求合作伙伴的时候从长远发展角度考虑,重点关注语音技术提供商的综合实力,要求技术供应商具有从语音合成到语音识别的全面技术领先。
当前,将车载导航设备与语音技术结合,也成为了各厂商普遍关注的增加产品亮点和竞争力的一条重要途径。
对于车载导航来说,有了语音合成,无论是千变万化的道路名称,还是随时到来的路况信息,都能随时播报;有了语音识别,目的地设定、路况信息查询,只需说出命令即可完成操作。“合成+识别”的理念和解决方案,真正实现了交互式的语音导航系统,从根本上解决了安全隐患,提升了汽车驾驶乐趣。
目前国内已推出的具有语音功能的导航产品中绝大部分应用的都是科大讯飞的语音合成技术,实现信息语音播报、语音操作提示等功能,并对于语音识别技术在导航产品中的应用与厂商共同合作进行预研和应用探讨。
据了解,在国内做语音导航研究的有多家公司,其中科大讯飞在中文语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。语音导航在车载领域的应用上,当关闭车窗的情况下,只要是普通话或与普通话相近的方言,科大讯飞语音一次性识别正确率都可以达到90%以上。此外,语音识别功能的成本已经降低,加入的硬件和软件授权费都在厂商和用户的接受范围之内,与语音车载导航的高性能、高附加值相比,可以说微不足道。
语音导航的车载价值
最大价值表现在:以语音合成、语音识别、语音编解码为方向的智能语音技术应用在车载领域,将改变汽车现有的人机信息交流方式,解放驾驶者的双手和双眼,使汽车具备更人性化魅力,体现个性化特色,提高驾车安全性。
0
讯飞牵手中兴通讯 推动TD无线座机技术改革
近日,全球领先的智能语音技术提供商科大讯飞与中国最具规模的通信解决方案提供商之一——中兴通讯公司,就智能语音技术在TD无线座机的应用开发达成合作,在这一具有广阔市场空间的新产品领域占据先机。
无线座机融合了固话与宽带等功能的多项功能,是中国移动为了争夺家庭用户市场而刚刚推出的一项业务分支。该终端兼具固话的通话质量高、低资费特点和移动电话的综合服务于一身,在以家庭为单位的通讯领域,具有可观的市场前景。
应用科大讯飞全球领先的智能语音技术,在原有功能的基础上,无线座机增加了来电号码、短信息、电话簿、即时时间的自动语音播报,不仅为老年人应用提供了极大的方便,而且用户可以一边忙家务一边收听电话上面的信息,还可以订阅天气预报、电子报纸、电子书籍等增值服务,所有的信息都可以由清晰流畅的语音朗读出来。语音技术在无线座机中的应用,增强了中兴通讯产品的市场卖点,提升了用户的使用体验,同时也推动了TD无线座机技术的改革。科大讯飞将与中兴通讯进行持续深入的合作,不断丰富、增强TD无线座机的语音功能。
0
科大讯飞获2009中国软件自主创新最具实力奖
第七届中国国际软件和信息服务交易会于2009年6月18日至21日在大连举行。在期间召开的“2009中国软件自主创新论坛暨《2009中国软件自主创新报告》”发布会上,大会组委会根据进行的“2009中国软件自主创新调查和评价”结果,评出“2009中国软件自主创新最具实力奖”企业10家,“2009中国软件自主创新最具活力奖”企业10家。科大讯飞以突出的自主创新能力和所取得的成绩荣获“2009中国软件自主创新最具实力奖”,是国内语音产业,也是安徽省内唯一获此殊荣的软件企业。组委会授予科大讯飞的获奖词是:“用智能语音核心技术征服世界,并带动中国语音产业整体发展”。
由中国国际软件和信息服务交易会主办的“中国软件自主创新论坛”是中国软件交易会首创的国内软件领域自主创新年度论坛,是国内软件领域最具权威性的自主创新专题活动和调研评比活动。“2009中国软件自主创新调查和评价”活动从企业资产规模情况、企业销售及利润情况、企业R&D投入占总资产比例、企业研发人员数量及占员工总数比例、企业新产品销售收入及占总销售收入情况、企业申请及获得专利数量、企业著作权登记数量等七大指标全面衡量软件企业的自主创新能力和综合实力。
科大讯飞作为中国最大的智能语音技术提供商,在智能语音技术领域有着长期的研究积累,并在语音合成、语音识别、口语评测等多项技术上拥有国际领先的成果。科大讯飞充分发挥语音产业龙头企业作用,对产业核心源头技术资源进行整合,通过创新的语音平台战略,与合作伙伴携手推动语音技术应用深入各行各业、飞入千家万户。科大讯飞已占有中文语音技术市场70%以上市场份额,开发伙伴超过500家,以讯飞为核心的中文语音产业链已初具规模。
颁奖典礼上,公司副总裁陈燕介绍了科大讯飞的自主创新经验,并在获奖感言中说道:“自主创新,一是要有远大的目标,二是企业要把自主创新作为发展的源动力,通过技术、产品、应用创新实现市场创新;三是要有很好的团队,要有奉献精神的团队,才能把创新做好。”
据悉,此次获得“2009中国软件自主创新最具实力奖”的还包括东软集团股份有限公司、上海征途信息技术有限公司、北京中科红旗技术有限公司、深圳市金蝶中间件软件公司等国内知名软件企业。
0
在2008年美国国际消费电子展(CES 2008)上,比尔•盖茨在演讲中描述了下一个“数字十年”的发展趋势,将智能语音技术视为未来技术发展三大关键趋势之首,认为智能语音将带来人机交互模式的根本性变革。
语音技术作为人机交互的重要方式,作为战略性和前瞻性的重要新兴产业,语音技术市场领域一直是国内外科学界和产业界的关注焦点和竞争热点,世界各国都力争取得关键技术突破,占据产业先机位置,并取得对语音产业的领导权。随着导航、手机等移动信息终端和学机、MP3等便携式消费电子产品的日益普及,语音技术在嵌入式设备中的应用也越来越广泛,语音技术开始真正走进了千家万户。
那么,目前嵌入式语音技术应用表现在哪里?未来,嵌入式应用又该向何处发展?带着这些问题,我们将为你一一揭开嵌入式语音技术应用的神秘面纱。
嵌入式语音技术应用现状
嵌入式产品的应用无处不在,语音技术的加入让嵌入式产品能“听”会“说”,变得更加智能和方便。特别是嵌入式产品体积受限,“看”屏幕信息不方便,利用语音技术“听”信息和语音命令操作机器,将嵌入式产品的便携性和实用性完美的结合起来。典型的应用环境包括以手机为代表的移动通信环境、以GPS导航为代表的汽车环境和以MP3/MP4、学机为代表的随身电子数码娱乐环境。目前,嵌入式语音技术应用主要表现在:
以GPS导航为代表的汽车环境
语音技术在车载导航行业中的应用,充分考虑了车载导航应用领域的语音需求,提升了语音合成与语音识别在车载条件下的效果,并针对该行业的应用需求提供全方面的解决方案。有了语音合成,千变万化的道路名称,随时到来的路况信息、区域信息,都能及时准确播报;有了语音识别,目的地设定、路况信息查询,只要说出命令就可以实现操作,真正解放了双手,提高了驾驶的安全性。
未来,语音系统将成为车载内信息获取、互动娱乐、程序操控的重要工具,真正成为车载设备综合控制终端,解放驾驶者的双手,为改善行车安全、提升车载娱乐价值、促进车载信息化发挥举足轻重的作用。
以手机为代表的移动通信环境
现在,手机“能听会说”早已不是一件稀奇的事。手机不再受屏幕大小、常处于移动状态、信息容量大难以获取的限制。语音交互的手机,使用更加方便、时尚。通过语音合成技术实现来电播报、短信播报、电子书朗读以及语音提醒、语音报时等功能。通过语音识别实现语音拨号、语音检索、语音命令操作手机等功能。朗读效果清晰、自然,语音识别效率高、反应快、实用性强。
随着科技的快速发展和3G时代的到来,智能化、人性化已成为了手机发展的主要方向。“能听会说”功能为手机行业带来了革命性变化,彻底改变了人与手机之间的交互方式,使人与手机之间的“沟通”变得更加自然与顺畅。
以电子词典、数码电子为代表的随身学、娱乐环境
语音技术在以学机为代表的教育行业中的应用,让所见即所听,特别对于不清楚单词发音,不清楚句子如何连贯朗读情况下尤为重要。教育电子行业所采用的语音系统在字词覆盖率和多音字合成准确率方面有较大的提升,朗读更准确流畅。语音合成技术的应用,实现中英文混读、英文篇章级朗读,以及声韵母和英文音标的朗读;语音识别技术的应用,实现语音搜索、声控命令操作等功能;口语评测技术,让用户可以进行跟读训练,跟读后系统给出分数和检错提示,针对性更强,进步更快。
目前,嵌入式语音技术应用已实现从教育电子行业到MP3/MP4/PMP、数字电视等数码电子领域的渗透。强大的语音功能,使得数码产品的使用价值得到巨大提升,成为新一代数码产品的最大亮点与卖点。“能听会说”的功能将进一步加强消费者与数码产品之间的交流互动,从而为消费者带来更便捷、更时尚的新潮体验。
0
随着讯飞TTS新奥燃气客服项目升级改造的结束,新奥燃气用户可以随时体验到全球领先智能语音技术所带来的便捷、实时、快速的客户服务信息查询。只要拨打自助客服热线,用户听到的信息反馈是借助讯飞语音合成技术形成的清晰、流畅、自然的自动语音播报,无需热线接听员逐一进行回答。在采用科大讯飞语音技术之前,新奥燃气客服热线都是靠传统方式的人工坐席及按键选择录音的形式进行解答。由于新奥燃气的业务范围不仅面向家庭用户,同时拥有大量的企业用户,以及车用燃气用户,在海量信息及每天数以千计的查询压力之下,传统人工服务模式早已不堪重负,其整体服务质量和用户体验都受到了很大的影响。
为满足不同用户的个性化服务需求,科大讯飞牵手新奥燃气,运用全球领先的语音合成技术,以自动语音播报形式为用户提供咨询反馈,使客服热线所面临的问题迎刃而解。用户可以通过自助语音服务查询所需的信息,只需要一个通信终端,对着话筒说出所需信息,如,“我想咨询一下天然气在使用时应当注意的安全常识”,系统便会自动转接到“使用常识”项目,将相关信息反馈给用户,实时、便捷。
科大讯飞语音技术在新奥燃气热线得到成功应用,提升了新奥燃气客服热线的服务质量,舒缓了人工坐席的压力,增强了新奥燃气的市场竞争筹码。同时,语音技术在与民生休戚相关的燃气行业中的应用,充分反映了讯飞语音技术已从高科技领域真正走入了寻常百姓生活,这也是对科大讯飞“科技服务社会”理念的最好诠释。
0
国际大赛连年夺冠讯飞获2009 NIST语种识别大赛桂冠
从刚刚结束的“2009 NIST”语种识别评测大赛上再传喜讯,科大讯飞报送的参赛系统获得本次大赛高难度混淆方言测试冠军、通用测试指标亚军的好成绩。这是既科大讯飞在2006、2007、2008年连续3年获得英文语音合成国际大赛(Blizzard Challenge)冠军,2008年获得NIST说话人识别评测大赛桂冠后,在语音技术国际大赛中为中国科技界赢得的又一重大荣誉。标志着中国在国际语音技术领域已取得了稳固的全面领先地位。
NIST语种识别大赛由NIST(美国国家标准技术署)组办,是国际上规模最大、影响力最广泛的语种识别评测,自2000年以来已成为NIST组办的语音技术相关的常规评测项目之一,每两年举办一次。语种识别是指识别出所给定的任意语音所属语言的种类,是语音识别关键技术之一。2009年NIST语种识别评测相比往年语种规模更大,测试范围达到23个语种,测试规模增加了7倍,其信道环境更加复杂 ,设置了高混淆度方言对的识别。
本次参赛单位包括美国麻省理工大学(MIT),意大利都灵理工大学(LPT),法国科学研究中心(LIMSI),捷克布尔诺科技大学(BUT),香港中文大学,台北科技大学,清华大学,中科院声学所、自动化所等15家国际、国内著名语音研究机构。评测采取公平、公正、公开的原则,按评测规则,各系统使用相同的训练数据集进行系统模型训练,在相同的测试数据集上给出测试结果(训练数据集和测试数据集均由NIST和Linguistic Data Consortium提供),由NIST采用统一评测软件对各系统测试结果进行评测,科大讯飞参评系统获高混淆方言对识别指标综合排名冠军,通用测试指标综合排名亚军。
此次在NIST语种识别大赛中夺冠,进一步巩固了科大讯飞在国际语音技术研究前沿领域的领先地位;同时也充分体现了科大讯飞已经在语音合成、语音识别、口语评测等语音关键技术领域全面拥有了处于国际领先水平完全自主知识产权的核心技术成果,对推动语音技术在各领域的深入应用具有重大意义。科大讯飞将始终坚持自主创新精神,保持核心技术持续领先、不断突破,为业界提供最领先的技术、最优的产品、最佳的服务,推动民族语音产业的快速健康发展。
0
2009年6月,科大讯飞正式推出新一代高性价比语音合成芯片XFS4041CN,该产品形式是由双芯片构成的套片,由XFS4041A和XFS4041B二颗芯片组成,通过 UART 接口或 SPI 接口接收待合成的文本,将文本合成为清晰流畅的语音输出(支持差分音频)。芯片采用QFP封装、功能丰富,可进一步拓展和提升语音技术在车载GPS调度系统、信息机系统等各种不同类型嵌入式设备中的应用。
XFS4041CN具有更为强大的功能,语音合成效果更加清晰、自然与准确。芯片集成了多种智能的文本分析算法,具备了更强的分词、多文本内码识别、多音字识别、韵律环境预测能力,可以自动识别和处理日期、时间、数值、金额、电话号码等不同文本,可以利用特殊的控制标识对芯片的合成效果进行语速、语调、音量、韵律上的调整,以及利用控制标识对姓氏进行准确的识别。
该芯片支持任意中文文本、英文字母的合成,支持GB2312、BIG5、UNICODE、GBK四种内码格式的文本,提供两男、两女、一个效果器和一个女童声共6种不同发音人风格,支持多种文本控制标记以提升文本处理的正确率,此外,针对不同行业应用,该芯片集成了20种常见的提示音效,同时支持外扩SPI FLASH,用户可以任意调用自己预先植入的提示音,为用户开发使用提供了极大便利,并可有效降低开发成本。
即日起,科大讯飞开始接收此产品的订货。相信作为科大讯飞新一代语音合成芯片,XFS4041CN以其卓越的性能与易开发特性,将为二次开发厂商产品增添新的亮点、卖点和竞争力,成为业界关注的焦点!
0
战略似乎没有对错,但要与企业彼时彼刻的实际情况相匹配。要落实一个新的战略,讯飞是否有足够的资源和能力来支撑,这是关键问题。谈到讯飞的语音家庭风暴战略时,刘庆峰提起当初索尼在市场成功创造了WALKMAN潮流的经典案例。“一流的企业满足市场,超一流的企业创造市场。”这是他给自己和团队提出的最高要求。不管这家技术主导的公司在未来的家庭语音市场上会有怎样的表现,目前来说它最需要的是尽快补齐自己在销售和品牌方面的短板。(记者:李瑛)
0
探索的另一个方向,是个人用户。讯飞相信,找到使语音技术进入千家万户的路径,是真正可以做大语音产业规模的战略方向。所以,讯飞提出了“语音家庭风暴”战略,而教育领域是讯飞选择的切入点。2008年成立的数码产品事业部,目前在力推的产品,是面向各中小学教师和学生使用的智能语音教学产品,这是一个包括软件、硬件和后台内容服务的完整的产品。而公司研发的“能听会说”的智能玩具,则将目标用户直接定在了亿万家庭的孩子身上。 直接向市场销售完整产品与只卖软件相比,在刘庆峰的比喻中,价值相差了百倍。但这个价值背后,是对企业更多能力的要求。在零售终端这个市场中,讯飞需要足够的市场运作能力和品牌影响力,这对以技术见长的讯飞而言,不能说没有危险。
选择了教育行业作为这一战略的切入点,可以看出讯飞经过了仔细的考虑。成立头几年讯飞就开始与国家教育部相关部门探讨如何把智能语音技术应用于基础教育领域,后来推出的普通话口语评测系统是目前唯一获得国家语委鉴定在十几个省进行试点并已开始在五个省(直辖市)正式使用的技术。对教育行业多年的理解和人脉的积累,为讯飞面向这一行业推出终端产品打下了一定的基础。智能语音教学产品在设计的过程中,反复征集了教育人士的意见,在功能上充分考虑了教师和学生实际使用的需求和体验。而讯飞推广这项产品的渠道是从教育部到各省的教育厅。推广几个月,全国已经有十几个省有了明确的合作意向,但距离实际订单,还有一定的距离。
推出“能听会说”的智能玩具,这个想法在讯飞已经酝酿了几年,但因为没有找到可以在市场上制胜的策略和资源保障而一直没做。今年讯飞推出了以卡通形象承载的智能语音玩具,目前在安徽本地做尝试性推广。关于讯飞的竞争策略,喜欢下围棋的刘庆峰做了个生动的比喻,“比方说这是一个棋子,假如我们想要,可能先在周围战略布局,布到最后这个棋子谁都认为非得拱手相让不可,不得不是我们的,润物细无声。”
从原来供应商的供应商,从原来的以技术为主要驱动力的企业向以市场和消费者需求驱动的公司转变,科大讯飞胜算几何?在结果出来以前,没有人能够给出答案。
采访手记:在人与战略之后
讯飞从99年成立后不久就确立了“宏伟蓝图”,到现实中在市场上艰苦的摸索,直到04年才达到盈亏平衡。期间的这几年,目标与现状的巨大落差对讯飞年轻气盛的团队而言是一个严峻的考验。“那个时候,企业就像每天都在流血,每个月都在花钱,但是我看不到钱从哪里来,或者偶尔来一单,第二天又不知道从哪里来。”刘庆峰回想起那时的艰难记忆犹新;而另一方面,背靠中国科技大学的讯飞公司,从成立伊始,就得到了当地政府的大力支持。
1999年创立公司时,只有300万的注册资金,很快就得到了几家地方国有企业的入股注资,资产迅速达到几千万。这种情况下,有人开始怀疑持续进行大规模技术投入却始终看不见收入的必要性,各种各样的想法纷至沓来。可以收购一些公司,迅速做大规模,或者,在刚刚兴起的国内资本市场上买壳上市,又或者,运用政府资源,做一些可以挣快钱的生意……诱惑摆在眼前。“大的产业方向有问题吗?没有。有人超越我吗,也没有。那么,就是需要时间去积累的问题。”这是刘庆峰自己当时对局势的判断。在艰难困惑的时候,人的因素起了作用,企业的发展方向没有发生偏移。
坚持技术领先,这个战略在讯飞至今的成长路径中非常鲜明。在这个战略的支撑下,企业在市场上摸索、尝试,经过不断的试错,找到了自己的市场定位,为其他企业提供好的技术和产品,而不是直接面对最终用户。随着在市场上的逐渐积累,面对产业发展还处在早期培育的现状,讯飞选择了尝试重新直接面对市场,企业的战略开始发生变化。