捷通公司多年致力于人机交互领域的研究,在手写识别、语音合成和语音识别领域掌握了多项核心技术,成为国内为数不多的同时拥有多项智能人机交互技术,并已成功实现产业化的高新技术企业。2006年8月,捷通华声人机交互(Human
Computer Interface,HCI)智能技术研发中心(简称HCI中心)的成立,更使公司拥有了将这几项核心技术进行整和、融合与产品化的平台。
一、适用范围
智能商务终端,如掌上电脑、智能手机、PDA、智能固话终端等
二、应用软件产品
1、手写输入法
应用技术:捷通嵌入式手写识别eJHWR技术
实现功能:短信、电话本、记事本、日程提示等文本的手写输入;深层菜单和其他信息的手写快速查询;网上聊天、邮件文本书写等。如下图,WinCE系统下,电话本录入界面。手写输入法提供候选字、联想字和其他常用功能按钮键,方便进行中英文、符号等的切换录入。
2、短信读者
应用技术:捷通华声嵌入式语音合成eJTTS技术
实现功能:提供短信语音播报。自动接收、朗读短信,也可随时停止播报。还可选择批量阅读未读短信功能。
3、手机听霸
应用技术:捷通华声嵌入式语音合成eJTTS技术
实现功能:提供语音播报,主要包括来电播报、语音报时、日程语音提示、状态播报4项功能。
ⅰ 来电播报:当有电话打进时,手机可自动提示来电人的姓名或电话号码及来电区域。
ⅱ 语音报时:按特定功能键,手机即播报日期、时间信息。
ⅲ 日程提示:自由设定日程提示,准时语音播报。
ⅳ 状态播报:当手机电池电力不足或话费不足时,系统自动播报充电、充值等提示信息。
应用案例:
北京德科互联技术有限公司,Smart
Phone、Pocket PC。
4、语音电话本
应用技术:捷通华声嵌入式语音识别eJASR技术、嵌入式语音合成eJTTS技术
实现功能:利用语音直接拨号。用户在手机系统提示下说出要与之通信的人名,即可拨通电话。
5、语音命令导航
应用技术:捷通华声嵌入式语音识别eJASR技术
实现功能:利用语音直接进入手机任意菜单、子菜单或执行其他相关命令。还可设“词条学习”功能,补充桌面系统在发展中出现的新词条,或是满足当用户想使用自己习惯的命令语汇时,特意改变命令。
三、核心技术
1、手写识别技术
手写识别是指将在手写设备上书写时产生的有序轨迹信息转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉字内码的一个映射过程。
捷通HWR技术,运用句法结构自学习算法和基于特征统计算法的多核心融和技术。可识别中文(简体6763+繁体5401+GBK21003)、数字、英文及各种特殊符号。支持连笔和无笔顺识别。识别率高达99%以上。识别速度MIPS 33M下0.4秒/字~0.6秒/字。数据字典大小可缩扩。支持各种嵌入式平台下的开发移植。
应用案例:
北京旋极奔月通信技术有限公司,PDA;
博讯数码技术股份有限公司,随身网络电脑“无线王”。
2、语音合成技术
语音合成又称文语转换(Text-to-Speech, TTS),是利用计算机将任意组合的文本文件转化为声音文件,并通过声卡、电话语音卡等多媒体设备将声音输出的技术,简单说就是让机器把文字资料“读”出来。
捷通TTS技术,运用增加音库压缩算法和声调变换算法形成核心技术。系统输出文字转换正确率96.59%以上,音节清晰度94%以上,句子可懂度97.83%,自然度基本与人正常说话持平。支持中英文混读。提供女声/男声/台湾女声/广东话女声等不同音色和语种的音库。音库大小可缩扩,小音库仅为400K--4MB。
应用案例:
日本株式会社高电社,PDA,中日文翻译系统语音播报。
卡西欧,电子词典,语音播报汉语词典内容。
3、语音识别技术
语音识别技术(ASR)是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。
捷通ASR技术,200词表下的识别率达96%,共可支持1000条词表的识别,支持Windows, Linux等各种操作系统。
公司在对外业务中,珍惜和尊重客户资源,大力发展合作伙伴,共拓商机、实现共赢。在软件产品的授权模式中,有按量授权、年度授权和买断授权等多种方式。针对不同的合作模式,采取多样化、合理化的价格体系,充分考虑软件产品的技术特点、市场生命周期等多种因素,保障合作双方的共同利益,诚信务实高效。公司主要提供以下产品形态:
l
提供嵌入式手写识别eJHWR、嵌入式语音合成eJTTS、嵌入式语音识别eJASR三大核心技术的SDK,并支持TI、展讯、MTK、飞利浦等各种主流平台和其他非主流平台下的移植开发。
l
提供手写输入法、短信读者、手机听霸、语音电话本、语音命令导航等多种手机应用软件产品。
l
基于捷通自主知识产权的eJHWR、eJTTS、eJASR三大技术核心,为客户定制各类个性化手机应用软件产品。
例如,基于嵌入式手写识别eJHWR技术,根据客户需求定制可识别字符集,增加新的字符及手势符号,适当压缩识别数据库以适应客户对内存和识别速度的要求,或者扩大识别数据库,以提高客户对识别率的需求。再如,基于嵌入式语音合成eJTTS技术,提供不同风格的音色,不同大小的音库,以及上层应用的开发等。
五、联系方式
北京捷通华声语音技术有限公司
地址:中国北京海淀区中关村软件园国永融通大厦2层
邮政编码:100094
电话:(8610)82826886
传真:(8610)82825830
网址:www.sinovoice.com.cn
电子邮件:marketing@sinovoice.com.cn
More Contact, More Possible!