文章正文

诗词 散文 小说 杂文 校园 文苑 历史 人物 人生 生活 幽默 美文 资源中心小说阅读归一云思

『人工智能+校对』的应用前景分析

时间:2023/11/9 作者: 现代出版 热度: 17053
胡佩 李小青

  摘要:当前计算机校对技术整体报错率高,对整句的纠错能力较差,对古籍的校对能力不足,对科技名词的纠错能力弱,对图表、公式及版式的校对能力弱。人工智能技术应用于校对有望提高字词校对的准确性、整句校对质量、校对结果的时效性、高科技名词的校对能力和古籍校对能力。人机协作趋势下,校对人员应熟悉机器特点,更新自身知识结构,增强自身工作创造性。

  关键词:人工智能;校对;人机协作;应用前景

  人工智能是研究开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学,研究目的是促使智能机器会听(语音识别、机器翻译等)、会看(图像识别、文字识别等)、会说(语音合成、人机对话等)、会思考(人机对弈、定理证明等)、会学习(机器学习、知识表示等)、会行动(机器人、自动驾驶汽车等)。①杰弗里·辛顿及其合作者完善了深度学习算法,为人工智能的商业应用奠定了基础,由此带动人工智能研究和应用的热潮并持续至今。

  由于人工智能广阔的应用前景和强大的产业驱动力量,包括美国、日本、欧洲在内的世界主要发达经济体纷纷从国家战略高度引导,在产业政策上培育人工智能技术。中国也于2017年7月发布《新一代人工智能发展规划》,制定了新一代人工智能发展“三步走”战略目标。国家层面的扶植和投入,极大地推动了人工智能的基础研究和商业应用,成为人工智能技术未来发展和普及的重要保障。

  人工智能的应用领域十分广泛。在新闻出版领域,人工智能在写作、组稿等方面已有所尝试,如腾讯的Dreamwriter、华盛顿邮报的Heliograf等。②校对是新闻出版领域中的一项基础性工作,本身具有相对客观化、规范化的特点,较之写作或组稿等工作更易于人工智能技术的实施。在智能化编校方面,一些最新的文献以及相应的数字出版产业年度报告均有提及,但未进行过深入分析,且未见实际应用。可见目前人工智能在校对领域的应用尚未普及。随着人工智能研究的深入和应用的推進,未来计算机校对有望从目前的自动化阶段提升到智能化阶段,从而大幅度节省人力资源。

  一、当前计算机校对技术的现状和不足

  当前市场上计算机校对软件种类繁多,既有文字处理软件自带的简单校对模块,也有功能更为强大的专业校对软件。中文校对方面,技术上较为成熟的主要是黑马校对和方寸校对两款产品。目前的校对软件是以主要由人工维护的字词库或语法库为依托,通过软件进行比对识别,查找错误并给出修正建议的。这一模式主要围绕字、词展开,对整句的语义解读和校对乏善可陈,且存在着字词库扩容之后误报率上升的固有缺陷。因此,这只能称为自动化,尚不足以称为智能化。虽然黑马校对和方寸校对两款主流软件在产品宣传中都宣称应用了人工智能技术,但笔者实际使用过程中的效果感受并不明显,例如字、词校对结果中并没有将一些常见的误报滤去,整句校对能力依然十分薄弱,数据库的更新仍主要依赖于人工维护而使时效性显得不足。现阶段校对软件普遍存在的不足主要有以下五点:

  一是整体报错率高。由于校对软件对错误的检查主要基于自身数据库与待校文稿内容的比对实现,对发现的不一致之处缺乏进一步核验机制,误报的情况比较普遍。随着软件自身数据库规模的不断扩大,误报率往往随之上升。有人根据经验评估,初次使用黑马校对时报红(软件认为肯定存在错误)的准确率在50%上下,报粉(软件认为疑似存在错误)的准确率在15%上下;经过手工添加针对性的专业字库并添加常用词维护后,报红准确率在70%上下,报粉准确率在20%上下。③鉴于此,大多数出版社在实际工作中都釆用人工校对后辅以软件校对的方式。

  二是对整句的纠错能力较差。软件一般只能简单地比对字词库,在语义层面并不能具体问题具体分析。比如在一篇关于资产减值方面的文章中,作者用五笔打字连续输入时,某一处“计提的差值准备不低于监管标准”,其中的“差值”应为“减值”,但校对软件无法根据上下文提示这一错误。又如,对于用拼音输入法输入的“曹操亲统大军与六倍的军队交锋”,“六倍”为“刘备”之误,校对软件同样没有任何错误提示。而类似的输入法错误在稿件中会经常遇到。

  三是对古籍的校对能力不足。由于古籍中文言文用字较少、语法结构复杂,且涉及通假字等情况,目前的校对软件基本无法有效识别文稿中存在的错误。

  四是对科技名词(即专业术语)的纠错能力弱。科技名词是汉语词汇中比较特殊的、专业性很强的一部分词汇,一般由西文翻译而来,经常出现同一概念在同一书稿中有不同叫法的情况。黑马校对对科技名词几乎无能为力;方寸校对有一定的术语识别能力,但仍十分薄弱。

  五是对图表、公式及版式的校对能力弱。目前校对软件对图表、公式等的校对仅停留在文本层面,而诸如图文不符、图(表)序错误、图表设计不合理以及图表或各级标题的版式等其他常见问题基本上只能依赖人工校对。

  二、人工智能技术在校对工作中的应用前景

  现阶段的人工智能技术,主要建立在以深度学习算法为核心的理论基础之上,借助于计算机并行运算能力的大幅提高,通过优化的算法对海量标准化数据进行处理和分析,得出一些有用的经验或结论,从而帮助人类在一些基础性的工作中提高决策效率。技术的边界,决定了现阶段的人工智能技术只能服务于一些简单且具备大数据支撑的基础领域。

  人工智能校对,是人工智能技术在自然语言处理方面应用的一个分支。相对于新闻撰写等主观性更强的领域,人工智能在校对中的应用更为便利。一方面,校对工作的客观性和规范性较强,这意味着人工智能在进行海量数据(语料库)训练后可以具备比人工更强的查错纠错能力;另一方面,校对工作中不可或缺的常识、分散化的专业知识、情感表达及审美等主观性、创造性的能力,又是当前阶段的人工智能不具备的。

  1.人工智能有望实现的功能

  一是提高字、词校对的准确性。字、词校对是校对软件的基本能力,但目前其突出问题是错误识别率高的同时问题报错率也高,因而校对的结果仍需人工进行大量复核确认工作,使用价值大打折扣。校对软件有望借助人工智能技术对已出版的规范文献或图书内容进行训练学习,以及对校样文本进行语义识别,自主对校样进行审核和纠错,将报错率降至可接受的水平。

  二是提高整句校对质量。目前的校对软件在文稿的整句校对层面较为薄弱,人工智能在语言处理方面的积累和进步有望在这方面提升校对质量。借助人工智能,可通过对文稿内容的解析以及对已出版的规范文献或图书内容的对比,评估待校语句可能存在的语义错误并给出可靠提示。

  三是提高校对结果的时效性。以黑马校对单机版软件为例,其内含79个专业词库、8,000万条海量词汇。人工智能技术介入后,有望在数据库更新时实现批量读取和分析,及时淘汰过期或错误的数据库内容,这对于一些时效性较强的政策语、流行语和新科技术语等的校对工作非常有帮助。

  四是提高科技名词的校对能力。通过将全国科学技术名词审定委员会公布的科技名词实时纳入数据库,并通过语义分析评判文稿中名词使用的合理性,从而给出准确的校对结果。

  五是具备古籍校对能力。人工智能有望发挥其在大数据训练方面的优势,通过对大量规范化处理后的古代文献的解析,在语义层面更好地理解文言文的语法结构和表达方式,弥补当前软件在古籍校对方面的短板。

  2.人工智能短期内无法实现的功能

  一是无法校对图表、公式等非文本内容。一些专业图书或文献中会出现较多的图表、公式,这些内容由于格式没有统一的標准,也缺乏足够数量的可比较样本,无论是传统的校对软件还是人工智能软件对此都无能为力,即使是可见的将来也仍然需要靠人工进行有效的校对。

  二是无法校对常识。文稿中涉及的诸多常识,如历史朝代、国家毗邻关系、人物生平等,在编辑看起来非常简单,但机器处理起来却异常困难。目前的基于深度学习的人工智能技术,对此并无良策。

  三是无法校对逻辑性错误。目前的人工智能技术在跨领域推理和抽象能力方面还不成熟,基本上无法识别文稿中可能存在的叙事先后、因果、并列不当等逻辑关系的错误。

  三、人机协作趋势下对校对人员的建议

  在当前人工智能的技术条件下,放弃完全依靠人工智能的幻想,充分利用机器在基础工作中的高效率和人工在创造性领域的独有优势,走人机协作道路,是兼顾校对工作效率和质量的现实选择。在人机协作趋势下,校对人员应注意从以下几方面提高自身的职业能力。

  一是熟悉机器的特点,做到扬长避短。就传统的校对软件而言,其对字、词的校对是强项,对整句、语义的校对是弱项;就未来的校对软件而言,在字、词的校对上功能可能会更加强大,对整句、语义的校对也有可能取得突破,但对于常识、逻辑关系等的校对依然会是弱项。校对人员在使用软件的过程中,可以结合具体的文稿,摸清机器校对的长处和短处,合理安排工作重点和软件使用的时机,以人机互补的方式提高工作效率和工作质量。

  二是关注前沿科技,更新自身知识结构。科学技术的更新迭代,可能让人类引以为傲的传统工作能力瞬间失去市场价值,例如计算器取代算盘、自动驾驶未来极有可能取代驾驶员等。在校对领域,新技术的出现也会使得一些过去积累的经验或技能失去价值。校对人员在平时的工作中可以适当关注科技热点,通过使用最新版本的校对软件等方式了解新技术的特点,及时淘汰过时的工作方式,更新自身知识结构,以此适应新环境下的工作要求。

  三是增强自身工作的创造性,积累有价值的工作经验。就目前的人工智能技术而言,它的能力边界不是无限的。在可见的未来,人类的创造性工作仍然是机器无法取代的。校对人员在日常的工作实践及学习中积累的特定领域的常识、文本规范和语言逻辑等方面的知识,是机器难以掌握和取代的,也是校对人员价值的最有力体现。校对人员可以在日常工作中注重培养和提升此类创造性工作能力,打造专属于人类自身的价值。

  注释:

  ①谭铁牛.人工智能的历史、现状和未来[J].求是,2019(4).

  ②武菲菲.人工智能技术与出版行业的融合应用[J].出版广角,2018(1):26-28.

  ③张渊.黑马校对软件应用当议[J].出版广角,2018(3):58-60.
赞(0)


猜你喜欢

推荐阅读

参与评论

0 条评论
×

欢迎登录归一原创文学网站

最新评论