手写识别技术是指通过手写板等轨迹捕获设备获得书写者的书写信息,将手写字转换输入计算机。用户在手写板和触摸屏上书写的笔画以类似于矢量图的形式被计算机存储下来,通过对文字图像的抬笔、落笔、笔迹上各像素的空间位置等信息进行处理与对照,系统将数据转化为计算机所使用的文字代码进行输出。
手写汉字识别技术发展历程
联机手写字符识别的发展历史可以追溯到本世纪50年代,伴随着手写板硬件(一种捕捉笔尖轨迹的数字化仪)的出现,人们开始研究联机手写字符识别技术。随着半导体和计算机技术的发展以及模式识别领域理论和方法研究的不断深入和完善,到80年代后期,联机手写字符识别技术的研究已经朝着实用的方向努力,特别是英文,已经开始研究完全无限制的整句识别技术。
联机手写汉字识别技术相对起步较晚。1981年,IBM公司推出了第一套较为成熟的联机手写汉字识别系统。该系统是基于对汉字进行笔划、字根编码的思想进行识别的。系统中每个汉字用72种字根拼成,而每个字根又可分解为42 种笔划的组合,通过对笔划和字根的判定识别所输入的汉字。对字根进行的编码树表示使得系统对通常的笔顺变化具有一定容错能力。当时对920个汉字的实验结果时正确率91.1%,对2260个汉字进行测试的结果,识别率为79.9%。书写者要求使用工整楷书。
而中科院在1988年提出利用笔段为基元的联机手写汉字识别技术。该方法把汉字分为笔段、笔划、字根、单字和词组五个层次,分别用模糊属性文法进行描述,以启发式模板引导匹配。该系统采用了对笔段进行基于位置关系的排序方法,摆脱了对笔顺的依赖。由于对整个字形进行采样后分析,在识别速度上不如按笔顺采样计算识别快。
台湾也正在进行联机手写汉字识别方法的研究。由于采用不同的思路,台湾的产品在连笔处理方面具有一定的优势,而对于笔顺的限制相对比较严格。从有限的一些资料来看,它们大致是基于笔段串的动态规划方法的。
北京捷通华文信息技术有限公司也是国内较早从事手写汉字识别技术研究、开发、生产的公司之一,其首席科学家、我国知名模式识别专家北京大学教授顾小凤先生应用自己几十年手写识别技术研究与应用的宝贵经验,在手写技术市场竞争日益激烈的环境中,指导华文团队不断钻研,开发完成了具有国内外最高水平的手写汉字识别技术,获得多项专利和软件著作权以及国际软件博览会金奖等数项大奖。其手写汉字识别技术对于一般书写的正确识别率高达99%以上,字库涵盖汉字21003个,完全支持GBK,识别范围包括中文简体、中文繁体、英文、数字及各种特殊符号,同时支持连笔草书、无笔顺书写等的识别,识别速度达到0.4秒/字-0.6秒/字。同时,用户可以根据自己的需求定制简体版、繁体版、简繁合一版等各种版本的识别引擎,GB2312、GB18030等不同可识别字符集,以及适应客户对内存、识别速度、识别率需求的识别数据库。强大的识别核心、贴心的定制化服务等使得捷通华文成为20世纪初国内为数不多的优秀专业化全系列手写汉字技术与方案提供商之一。
手写汉字识别技术应用趋势
手写汉字识别技术发展至今,无论在识别率(几个大厂商几乎都可以达到98%以上)还是识别速度方面都可以称之为相当成熟的技术了,完全能够满足实际应用的要求。手写汉字识别技术的应用主要涵盖以下两个方面:
桌面操作系统中的应用
上世纪90年代以后,手写汉字识别技术真正大规模应用在PC机、笔记本电脑、平板电脑、手写板等桌面操作系统中。随着计算机大量走入家庭,键盘汉字输入越来越“不合时宜”。因为许许多多的来自普通家庭的用户对计算机的使用并不很熟练,要让这些用户再掌握一门编码的汉字输入方法就更难了。相对于键盘输入方式,手写笔输入是一种“直接”方式,因为屏幕上显示的和输入者写的字具有同样的结构。手写笔输入是人们在纸上书写汉字方式在电脑上的直接延伸,它更为自然、更符合普通中国人的书写习惯。手写输入避免了键盘输入法因拆字不习惯、发音不准造成键盘的重复输入,又不会造成写作时那若隐若现的一丝灵感变得荡然无存。它使得电脑摆脱了键盘和鼠标,使用起来轻松简单、得心应手,有效降低普通用户使用电脑的门槛。目前手写笔除了满足基本的汉字输入需求以外,还具有语音、绘画等功能,大大提高了人机交互的自由化、生活化。如目前市场上最高端的手写笔产品之一—— “中华笔”,不仅集成了捷通华文具备国际领先水平的手写汉字识别技术,使用户在手写输入上有了更大的自由度,可以用简体、繁体、正楷、行草、连笔、倒笔等多种不同写法进行输入;同时创造性的将手写识别技术融合了语音技术,可以通过语音合成技术实现对输入的汉字进行即时语音校对等功能。
嵌入式操作系统中的应用
手写汉字识别技术在嵌入式操作系统中有很多成功的应用,例如掌上电脑、手机、PDA等智能移动终端;个人信息终端、车载信息终端等GPS/GIS终端;eBOOK、电子词典、智能玩具等智能学习终端;税控机输入终端、二代身份证读卡信息终端、大型数据库查询终端、酒店管理系统输入终端、智能报警器、数字电视互动遥控器、卡拉OK点歌器、信息家电控制器等其他数据终端。
20世纪90年代末,手写技术最成功的应用是在PDA上的应用。从1999年到2000年,中国PDA产品市场迅猛发展,在短短的一年间膨胀到100万台的市场规模。随着市场的成熟和人们信息需求的提高,小体积大屏幕的PDA配备手写笔是必然趋势,而中文手写输入成为PDA最吸引人的功能,所以当时PDA的竞争演化成中文手写识别技术的竞争。
20世纪初,继PDA之后,手机又进入了“手写技术时代”。据预测,2006年中移动短信发送量将达到5000亿条。短消息的流行使得手机用户对汉字输入功能的要求越来越高,然而,手机不同于计算机,少量的几个数字按键实在不方便实现文字的输入,而且手机的普及率远远高于PC,不可能要求不同文化程度、不同语言习惯的手机用户去掌握复杂的按键输入法。于是,手写汉字识别技术被广泛的应用在手机上,手写手机成为高档手机的标志,使用手写手机也慢慢成为成功人士的潮流。业界专家认为,随着手机短信持续火爆和智能终端的普及,未来几年手机手写技术的运用还将持续增长。但手写识别是技术含量很高的智能科技,需要多年的技术积累;再加上手机使用的是嵌入式技术,中央处理器运转速度与电脑CPU不可同日而语,致使手机上的手写汉字识别技术门槛很高,能提供此项技术的国内企业也屈指可数,其中捷通华文凭借深厚的手写技术功底、丰富的实践经验成为少数几家提供嵌入式操作系统应用的中文手写技术与产品提供商之一。
时下,学习机又成为手写技术应用的一个亮点。用户在使用传统学习机时一般通过点触输入,这种人机交互效率低,不容易调动学习兴趣。手写技术的应用彻底革新传统学习机输入方式,实现了更快速输入汉字、英文、数字和符号的功能。对于使用者来讲,一般习惯于手写方式,因为在学习过程中,手写方式不仅效率高,而且更能实现眼、耳、口、手、脑五维立体记忆联动,提高孩子的学习思维连贯性,使得学习效率高,记忆更加深刻。如果说手写功能应用在手机、PDA、手写平板电脑上的主要目的是满足日常工作、商务和生活的需求,而手写输入功能在学习机中的应用更多是从学习思维与习惯记忆的角度而进行的革新,这种应用使得手写功能不再是一个单纯的输入技术,而是与学习紧密的结合起来,是典型的人本化的体现,比以上几个领域更具有实质性意义的应用。
手写输入作为唯一一种在既保持汉字文化的同时,又可以很好的跟电脑实现交互的方式,随着手写汉字识别技术的不断进步和以捷通华文为首的民族企业的不断努力下,必将为我国的信息化建设和全民电脑普及运动做出不可估量的贡献,以其出色的技术和产品切切实实地改变人们的生活,让更多的用户享受到最理想的人机智能交互技术与产品!