应用语言学论文

您当前的位置:学术堂 > 语言学论文 > 应用语言学论文 >

AI写作运用的现状和注意事项

来源:写作 作者:杨逸云
发布于:2021-08-10 共8608字

  摘    要: 人工智能写作包括自动写作和辅助写作两种形式。我国人工智能写作的发展得到国家政策的支持,人工智能写作应用有着巨大的市场需求。在应用写作中,人工智能技术主要用于新闻写作。在文学写作中,人工智能的应用较少,其中诗歌的数量高于小说。作为新出现的技术,人工智能写作一直备受争议。人工智能创作的内容是否具备独创性、人工智能写作能否突破模式化、写作语言能否更加自然,都是值得探讨的话题。

  关键词 :     人工智能写作:写作软件.应用写作,文学写作

  Abstract: Artificial intelligence writing includes two forms:automatic writing and assisted writing. The development of artificial intelligence writing is supported by national policies in China,and there is a huge market demand for artificial intelligence writing applications. Artificial intelligence technology is mainly used for news writing which belong to practical writing. There are fewer applications of artificial intelligence in literary writing,while the number of poems are much higher than novels. As a new technology,artificial intelligence writing has been controversial. Whether the content created by artificial intelligence is original,whether artificial intelligence writing can break through the pattern,and whether the writing language can be more natural are all topics worthy of discussion.

  Keyword: Artificial Intelligence Writing; Writing Tools; Practical writing; Literary Writing;

  近年来,人工智能写作现象频繁引发公众关注,随着微软小冰诗集的迅速“出圈”以及机器新闻写作的广泛应用,不少写作者担心自己的职业会被取代。虽然“机器人成立作家协会”1目前看来尚无可能,但是智能化浪潮下,人工智能写作的发展趋势很难预测。人工智能写作是会彻底取代人的写作,还是会始终停留在目前的水平上无法取得突破?抑或是走向二者并驾齐驱、人机协同写作的未来?由此,对当前人工智能写作的应用现状进行研究,厘清其中存在的基本问题,就成为了十分必要的工作。

1.png

  一、关于人工智能写作

  (一)人工智能

  “人工智能”(Artificial Intelligence)一词产生于1956年美国达特茅斯会议,该会议的主题是“用机器来模仿人类学习以及其他方面的智能”,这是对“人工智能”最初的解释。自此之后,人工智能不断发展,但对于这一概念的定义,学界尚未达成共识。从字面上看,artificial在韦氏字典中被解释为man-made(人造的),反义词是natural(自然的)。因此,人工智能是通过人为设定的方法和流程,而不是自然创造出来的智能体。目前,学界对于人工智能的争议主要是对智能程度的理解不同。有些学者认为,人工智能不过是给“自动化”披上了神秘的外衣,还未达到预期的标准,它无法完全模仿人类思考和学习。按照人工智能的发展水平,我们通常将其分为弱人工智能(Artificial Narrow Intelligence)和强人工智能(Artificial General Intelligence)。弱人工智能只在某一方面表现出智能,但是不具有与人类相当的智力水平和思维模式。阿尔法狗可以打败世界围棋冠军,但它并不能处理其他领域的问题。强人工智能则是指机器可以像人一样独立自主的思考。不可否认的是,当前我们正处于弱人工智能阶段,生活中已经广泛应用的机器人、语言识别、图像识别等技术,都只能解决特定场景的问题,它们都是弱人工智能的体现。

  (二)人工智能写作

  人工智能涉及数学、心理学、神经生理学、信息论、计算机科学、哲学等多个学科,写作则是一项需要有文学、语言学等知识积累的脑力创造活动。人工智能写作(Artificial Intelligence Writing)是人工智能技术与写作结合的产物,是近几年来人工智能的新兴热点话题。人工智能写作,又被称为“机器写作”,它并不是由有形的机器人完成,而是通过算法自动生成。因此,人工智能写作也被称为自动化写作(Automated Writing)。在人工智能应用到写作领域之前,计算机首先改变了人的写作方式。最初,人们使用电脑写作,利用互联网传播文章,可以得到及时的反馈。电脑写作改变了人们的书写习惯,使人们更快地从网络上收集素材,大大减少了写作时间。人工智能写作比电脑写作更加便捷,它可以根据写作范围建立数据库,直接从数据库中获取素材,再利用算法完成写作。

  图1 人工智能写作

GetImg.jpg

  人工智能写作主要包括自动写作与辅助写作两种形式。自动写作不属于强人工智能,它不是指计算机按照自己独立的想法写作,而是指写作的过程中没有人工干预,通过算法完成写作任务。自动写作多应用于“结构化”类型的写作,例如新闻快讯、智能诗歌、智能春联等。这几类写作都有一定的规律可循,计算机根据对应的算法,直接生成符合特定格式的内容。另外,自动写作还被一些自媒体人用来“洗稿”。他们通过自动写作的平台,以改变文字排序、替换数字和单词、插入文本链接等方式重新组织语言,将互联网上的原创文章二次加工。辅助写作是指在人类写作的整个过程中,通过算法提供多种辅助功能,协助人类完成写作任务。从写作之前的构思,到实际写作中的选材,再到完成写作后的修改等,都可以使用辅助写作。自媒体人还可以利用辅助写作工具,为写作内容添加标签,通过个性化推荐将自己的文章精准地推送给感兴趣的用户。

  无论是自动写作还是辅助写作,二者均未达到真正意义上的智能。从写作主体上看,人工智能的创作主体是机器,但操控机器的仍然是人。从写作客体上看,人工智能写作基于大量的数据库,而数据库中的内容也是人类创作的。由此,我们可以这样定义人工智能写作:以人工智能技术为基础,通过数据统计及深度学习等方式完成写作,其目标是为了帮助人类提升写作效率,探讨人类写作的本质规律。换而言之,人工智能写作主要是通过人工智能技术,更深入、细致地分解写作的形成过程,理解人类写作的奥秘,帮助人类更好地完成写作。

  二、人工智能写作的应用现状

  国内最早对人工智能写作的探索是在诗歌领域。1984年,中学生梁建章自主设计了一个诗歌创作程序,这个程序可以在不到半分钟时间内创作出一首五言绝句。之后,人工智能开始在写作领域缓慢地发展,涉及的写作形式越来越多样。人工智能在写作上的广泛应用主要始于2015年。2015年8月,腾讯推出由机器人“dreamwriter”创作的稿件,自此,人工智能写作开始为公众所熟知。随后几年,媒体纷纷效仿设计了自己的写作机器人。

  我国人工智能的发展得到国家政策的大力支持。2017年3月,在十二届全国人大五次会议的政府工作报告中,“人工智能”首次被写入政府工作报告。同年7月,国务院发布《新一代人工智能发展规划》,确立了新一代人工智能发展三步走战略目标,将人工智能提升到国家战略层面。近年来,医疗、养老、教育、文化、体育等多个领域都出现人工智能的身影。相对这些领域而言,人工智能写作的发展是较为滞后的。2018年6月,中国智能写作产业联盟在北京成立,国家工信部信息化与软件服务业司司长谢少锋表示,智能写作产业与蓬勃发展的智能语音产业相比,目前还处于起步阶段。2当前我国的智能语音行业已初具规模,有很多产品投入到市场中,例如手机中的虚拟语音助手、家居生活中的智能音箱等等,都已融入我们的日常生活。而人工智能写作的商业化产品研究,除百度、腾讯等互联网巨头外,从事人工智能写作开发的公司数量较少,但正在逐年增加中。

  人工智能写作应用有着巨大的市场需求。虽然人工智能写作不能完全替代人类写作,但能帮助写作者减少重复性劳动,使他们有更多的精力进行更有意义的写作。尤其对于自媒体编辑来说,有了智能写作平台的辅助,就不必再去网络的海量信息中慢慢搜寻素材,节省了写作时间。国家工信部信软司在中国智能写作产业联盟成立大会上还表示,我国智能写作产业的发展不能满足潜在的巨大市场需求,信软司将通过政策引导、工程引领以及搭建公共平台等方式,发挥协同优势,激发市场信心和活力,全力支持智能写作产业的发展。3目前市场上的人工智能写作平台可根据其功能分为两类:一种用于伪原创的文章编写,例如小发猫AI+智能写作、爱发狗软文助手等。另一种用于辅助自媒体人的写作,例如秘塔写作猫、有专自媒体助手、Get写作、智搜写作等。从时间上看,大多数人工智能辅助写作平台是在2017年后建立的,这也证实了近些年来公众对人工智能写作需求的进一步增长。随着互联网的发展,人们会越来越多地从网络上获取信息,人工智能写作必然存在着较大的潜在市场。

  表1 国内部分人工智能写作平台

GetImg (1).jpg

  从写作的角度,人工智能写作可以分为人工智能应用写作与人工智能文学写作。应用写作与文学写作不同,它偏重实用性,是客观实际的体现;而文学写作则偏重审美性,要求作者“神与物游”,把自己感知到的一切,用优美的文字传递出来。人工智能写作在不同的写作领域发展不一,有的应用较多,有的还处于开发阶段。

  (一)人工智能应用写作

  1. 新闻写作

  人工智能在写作中应用最多的领域是新闻写作。2014年,美联社自主开发了wordsmith程序,主要进行财报类的新闻写作,这是最早出现的智能新闻写作应用。中国紧随其后,2015年,腾讯和新华社分别推出各自的写作机器人“dreamwriter”和“快笔小新”。到目前为止,已有不少的新闻媒体使用自己的写作机器人(见表2)。

  表2 国内主要新闻写作机器人一览

GetImg (2).jpg

  由上表得知,国内人工智能在新闻写作中的应用自2015年后不断增加,2016年和2017年增长幅度最大,近来又逐年减少。其次,写作机器人都集中在特定的领域,以财经、体育最多,兼有民生、时政、天气等。除上述所提到的领域外,还有一些领域是人工智能暂未涉及到的,例如房产、游戏、军事等。

  2. 公文写作

  公文写作是各类写作中对语言规范、字体字号的格式要求最高的一种。由于其中要用到的核心技术——语义识别又不能达到完全准确,因此人工智能在公文写作上的应用出现较晚。2019年,金山wps推出了公文辅助写作——“wps智能写作”应用小程序。它可以通过确定写作关键词,帮助我们自由选择段落及对应的素材,最后生成文章。“wps智能写作”是最早出现的智能公文辅助写作应用,在实际应用中,它拟定的公文类型还不够全面,多偏向于评论汇报类。

  3. 广告写作

  人工智能在广告写作上主要分为两种类型。一种是自研自用,例如淘宝和京东两大电商,它们以自身平台的海量优质内容为依据,分别推出了“阿里AI智能文案”与“李白写作”。目前,这两个智能广告文案写作均可在1秒钟生成上万条商品文案,生成速度快。第二种通过人工智能技术供应商生成内容,例如弈写、智搜、GET智能写作等应用平台,都可以辅助自媒体人写作,并为其提供热点话题推荐、内容创作方案。

  4. 论文写作

  人工智能在论文写作中的应用较少。2019年,英国伦斯勒理工学院、美国华盛顿大学等研究人员初步实现了运用人工智能技术写论文,在他们发表的Paper Robot:Incremental Draft Generation of Scientific Ideas一文中,Paper Robot可以帮助构建论文的背景知识图,写摘要、关键内容和标题,梳理结论并给出进一步的研究方向的建议。但它的最终目的并不是要替代人类的论文写作,而是为了帮助科学家加快科学研究进程,只起辅助作用。

  5. 合同写作

  合同是经济活动文书的一种,人工智能在合同写作上的应用也刚开始出现。2019年神州泰岳公司在第二十三届软博会上展示了“合同审核”智能写作软件,显示了我国人工智能在写作领域的又一次扩展。

  (二)人工智能文学写作

  人工智能在文学写作上的应用相对较少。我国人工智能技术在文学写作中的应用主要集中在诗歌领域。2014年微软(亚洲)互联网工程院推出智能机器人“微软小冰”,人工智能文学写作才开始受到广泛关注。2017年“微软小冰”的诗集《阳光失了玻璃窗》出版,这部被称为人类历史上第一部完全由人工智能创作的诗集,引起了社会轰动。同年,清华大学自主研制的人工智能诗歌写作系统“九歌”在央视节目中向三位青年诗人发起挑战,并成功通过现场观众图灵测试(意味着观众无法通过所创作的诗词区分出人类和人工智能)。除此之外,上文提到过的京东智能写作平台“李白写作”、封面新闻中的“小封”写作机器人和“wps智能写作”小程序都有写诗的功能。“小封”在封面新闻中开设了“小封写诗”的专栏,目前篇均阅读量保持在4万次左右。人工智能技术在现代诗、古诗上都有应用,但总体水平并不高,暂时没有超过人类写作水平的可能。除诗歌写作之外,有一些智能写作平台专注于辅助写作者进行小说、散文的写作,写作者可以在这些平台上寻找写作灵感、获取写作素材。

  三、人工智能写作的应用问题

  随着科学技术的进步和提高,以人工智能为代表的工业4.0时代已经到来4。“网络文化”的发言人和观察者凯文·凯利说:“未来20年最伟大的事情可能还没有出现,但可以预判的是,人工智能将是未来20年内最重要的技术趋势。”5人工智能发展迅速,许多应用已被广泛使用,但仍有不少人持悲观态度,认为“人工智能比太空旅行更难实现”6。确实,在弱人工智能阶段,很多技术还未发展成熟,因此导致人工智能写作存在种种争议。

  (一)数据的收集和处理——隐私和版权争议

  大数据的挖掘和分析是互联网发展的重要手段,数据的收集和处理也是人工智能写作中的重要环节。人工智能写作的原理,就是运用大数据分析,将大量的数据统合进系统当中,使用对应的算法生成内容。人工智能写作主要包含三个阶段:处理数据、选择算法、生成内容。

  在大数据时代,信息开放使数据的价值得到充分体现,但与此同时也给个人隐私保护带来了严峻的挑战。由数据泄漏导致的隐私问题是互联网发展过程中的共性问题,相对而言,人工智能写作的版权问题更加突出。首先,我国《着作权法》中保护的对象是作为创作主体的人,虽然人工智能写作的主体是机器,内容由算法生成,但处处都有人的参与。因此,人工智能是否具有创作主体的资格,创作的内容是否具备独创性等问题都影响着最终版权归属的判断。近年来,关于人工智能写作版权的问题一直被广泛议论,通过人工智能写作平台生成的文章是否涉及抄袭,抄袭人工智能生成的文章又是否造成侵权,都是谈论的热点。一方面,人工智能写作的内容主要源于数据的拼接和处理,而大部分数据又来源于人。从这种意义上说,只有人类才是创作的“源头”,人工智能的创作只不过是将别人的东西拿来己用。如果人工智能写作未对他人的数据库或网络上的数据取得第三方授权,那么就会涉及侵权问题。互联网上用人工智能写作平台进行“洗稿”的文章,即是这一类型的代表。这类写作者只用简单地复制粘贴,就让“自己的文章”在网络上传播,对于原创者来说是很不公平的。如果这种行为没有受到相关法律的制约,就会打击原创者的积极性。另一方面,即使人工智能创作出的作品是基于合理数据的算法生成,那么其创作出的作品是否得到《着作权法》的保护,这一问题也有待解决,目前我国已有两例此类案件。2018年,北京菲林律师事务所起诉百度网讯科技公司侵权案中,北京互联网法院认为涉案分析报告和图表是由大数据自动生成,未引入任一方的个性化判断与选择,不能纳入《着作权法》所保护的作品范畴。而2020年腾讯公司状告“网贷之家”案宣判结果却认为,人工智能生成作品属于《着作权法》保护范围。判决书上显示:“涉案文章由原告主创团队人员运用Dreamwriter软件生成,其外在表现符合文字作品的形式要求,其表现的内容体现出对当日上午相关股市信息、数据的选择、分析、判断,文章结构合理、表达逻辑清晰,具有一定的独创性。”由此可见,我国人工智能写作版权的司法实践中,并未形成一致的观点。

  (二)基于算法的内容生成——模版痕迹强

  人工智能写作主要运用自然语言处理、知识图谱、文本分析等技术。在大数据时代,人工智能写作可以迅速通过对应的算法生成文章,一定程度上加快了文章的写作速度。2017年8月8日四川阿坝州九寨沟县发生7.0级地震,中国地震台网的“地震信息播报机器人”仅仅用25秒就编写了一条消息。人工智能新闻写作在速度上的优势非常明显,提高了传播的时效性,但同时也有其局限性。

  目前,新闻写作机器人只能撰写消息类稿件,不能完成深度写作及人物专访。人工智能新闻写作一般通过算法智能选择模板组合生成新闻,模式化明显。以今日头条的智能写作机器人——足球记者小明为例,在它发布的法国足球甲组联赛的系列新闻中,标题部分都是以几种组合方式呈现:当场比赛热门球员得分+比赛的结果;当场比赛某球员犯规+比赛结果;比赛结果+比赛精彩瞬间。例如“奥辛亨攻入两球!南特客场1-2负于里尔”“布雷斯特1-1打平图卢兹!Efthymis最后时刻绝平救主”。其次,在内容上,都是以比赛背景、比赛过程、出场阵容、比赛赛程几个版块组成。体育类活动开始和结束的时间确定,结果较好预测,且球员的数据信息相对完整,因此非常适合用人工智能技术完成写作。但在几次国外进行的人机新闻对比测试当中,机器新闻均以速度取胜,却在可读性上败于传统新闻。

  人工智能写作在古诗中的应用亦是如此,几乎都是将原有诗人的诗词、句拼凑,然后再填充到不同类型的诗歌当中。以清华大学计算机诗词创作系统——“九歌”为例,当我们将类型限定为五言绝句,输入关键词“秋天”时,生成的诗句是“秋天爽气清,月色照江城。万里烟波远,千年草木荣。”这首由人工智能生成的诗,其中每一句都能在古诗中找到出处。第一句“秋天”是输入的关键词,“爽气清”来源于宋朝刘子翚《晨兴》的“爽气清如沐”;第二句从字面上看可以理解为“月色照人愁”(陆游《五鼓送客出城马上作》)与“如西子镜照江城”(欧阳炯《江城子·晚日金陵岸草平》)的结合。后两句中“万里烟波”“草木荣”这种搭配在古诗中都出现过。由此看出,“九歌”创造出来的诗句只是在古诗中选取了一些相关的词语,然后调整了词语的搭配顺序,表面看上去对仗整齐,实际上句与句之间并没有太多的逻辑联系。

  由于人工智能的运行机制是基于算法的内容生成,这样一种运行机制决定了人工智能写作只能凭借数据最优解的选取进行所谓的文学创作,这也在客观上决定了人工智能的创作只是文字符号的筛选与排列组合,而非真正意义上的人类创作7。

  (三)自然语言处理技术——语言不自然

  自然语言处理(NLP,Natural Language Processing)是人工智能领域中的重要方向之一,也是人工智能写作使用的核心技术。自然语言处理的关键在于研制自然语言通信的计算机系统,从而达到人机间的自然语言通信。人工智能写作首先需要计算机理解自然语言(自然语言理解),然后再用自然语言表达出来(自然语言生成)。由于自然语言有着多样化的表达形式,在上下文语境中经常会出现多义、歧义的语句,有的还需要特定的知识背景才能理解,涉及人类认知的层面,探索起来困难重重。

  虽然自然语言有规定的语法,但人类在真正使用语言的时候会有许多新的创造。如果让一个人对同一场景进行十次描述,他每次都会使用不同的词语,但到计算机当中就毫无创造力可言,它会以“主谓宾—主谓宾—主谓宾……”的结构类推下去。很明显,人类并不会这样说话8。正因为自然语言很难把握,人工智能新闻写作的实践远高于人工智能文学写作。新闻写作针对性强,格式比较固定,可创作的空间小。而文学写作,尤其是小说写作,写作者需要构思文章的主题、结构、人物、场景等等,对创造力及语言运用的要求较高。但是我国人工智能写作又始于文学写作中的诗歌,因为诗歌这样一种特殊的文体,一向被认为是没有语法或不遵循语法的,其中词语的不合理搭配还可以被阐释为“陌生化”的艺术手法,这种对语法要求较低的文体类型最适用于人工智能写作。因此,人工智能在语言运用要求较高的小说文体中实践极少。

  人工智能写作要想取得关键性的突破,就必须学会理解和生成自然语言,否则,计算机永远无法像人类一样自然地表达,这与强人工智能的目标完全一致。由此可见,自然语言处理的未来与人工智能的整体发展密切相关。

  四、结语

  人工智能应用如雨后春笋般涌入我们的日常生活。人工智能写作依靠大数据、自然语言处理、文本分析等技术扩大了写作领域的应用范围,从最初的机器新闻写作到如今的智能公文写作、论文写作等,人工智能写作将帮助不同领域的写作者更高效地完成写作任务。目前,我国仍处于弱人工智能阶段,正朝着强人工智能阶段发展,技术的进步会逐渐克服人工智能写作应用中出现的种种问题。另外,我们要利用好人工智能写作的优势,不管是自动写作,还是辅助写作,都必须与传统写作协调发展,最终形成一种“人机协同”的工作模式。当前人工智能写作行业的缺口已经打开,未来的发展将有无限可能。

  注释

  1韩少功:《当机器人成立作家协会》,《读书》2017年第6期。

  2(1)《中国智能写作产业联盟成立》,中国新闻网,发表日期:2018年6月30日。

  3(2)《信软司参加中国智能写作产业联盟成立大会》,中华人民共和国工业和信息化部,发表日期:2018年7月3日。

  4(1)工业4.0是利用信息化技术促进产业变革的时代,也就是智能化时代。

  5(2)叶静宇:《凯文·凯利:未来20年创业的方向就是将人工智能应用于某个领域》,界面新闻,发表日期:2016年11月7日。

  6(3)[英]惠特比:《人人都该懂的人工智能》,郭雪译,杭州:浙江人民出版社2019年版,第3页。

  7(1)赵耀:《论人工智能写作的可能与限度》,《福建论坛(人文社会科学版)》2020年第7期。

  8(1)[美]斯加鲁菲:《智能的本质:人工智能与机器人领域的64个大问题》,任莉、张建宇译,北京:人民邮电出版社2017年版,第182页。


作者单位:武汉大学文学院
原文出处:杨逸云.人工智能写作的应用现状与问题[J].写作,2021,41(01):109-115.
相关内容推荐
相关标签:
返回:应用语言学论文