独家揭秘网文写作神器:日更三万字,“抄”三百本不是梦

2017年03月24日 腾讯娱乐


本文由腾讯娱乐原创,微信号:txent




网络作家在青和她的朋友们最近有点焦虑。


今年2月,包括在青在内的11名网文作家以小说《锦绣未央》涉嫌抄袭219本书为由,联合起诉该书作者周静(笔名秦简),索赔210万元,北京朝阳区法院已经立案。在2月15日的证据交换现场,被告方周静提出举证延期,获得法官同意。如今,时间已经过去整整一个多月,一审还没有开庭。



其实,在青对这次官司的胜算有一定信心,尤其是最近著名作家温瑞安也加入了他们的维权队伍,让她和朋友们感到振奋。不过,焦虑也是难免的,毕竟为了等待这一天,他们已经奋斗了1000多个日夜:整理《锦绣未央》涉嫌抄袭的大量证据,耗费了他们整整三年的时间。


在青并不讳言,她怀疑“秦简”在写作《锦绣未央》的过程中使用了一种写作辅助软件:往其中输入关键词,软件就会自动抓取大量现成的网文字段以供用户“借鉴”。“不然她不可能抄袭面有这么广,囊括了起点晋江红袖等文学网站,甚至连天涯情感贴、豆瓣影评贴都有。”但原作者“秦简”一直公开坚决否认抄袭。



《锦绣未央》案目前还尚无定论,网文圈内暗藏的“写作神器”却意外浮出水面。近期,作家“大风刮过”分别有《张公案》和《桃花债》两部作品陷入被抄袭纠纷,网剧《热血长安》第四集剧本因涉嫌抄袭“大风刮过”的《张公案》之《鬼笔筒》被下架;但后者与热门IP《三生三世十里桃花》之间的著作权纠纷,至今仍是无头公案。采访中“大风刮过”也透露很多人被“写作软件”误导。据知情人爆料,这种号称“一天能写三万字”、“让你轻松变身网文大神”的软件,一度在高速发展的网文圈很盛行。


有人认为,使用这种软件很容易纵容抄袭,应早日取缔;也有人认为,技术本身没有善恶,不能让写作软件为抄袭者背锅。这种“大数据写作”方式到底应该何去何从,正在成为一个全新的伦理话题。


“写作神器”有多神?

一分钟码完2000字的大纲,轻松日更3万字


“动动手指一秒变身写作大神”、“网文日更万字不是梦”……打开某网购平台,琳琅满目的“写作神器”正在以充满诱惑的口号,向人们展示一条通往“成功”的捷径:设置标签,添加人物、主题、情节等要素,上千字的故事梗概便能自动生成,再根据关键词采集信息“续写”情节,一篇小说便大功告成。这便是网络作家在青口中的写作辅助软件,为了一探究竟,腾讯娱乐随即网购了这款“神器”。


购买“写作神器”的渠道很多,打开某网购平台输入关键词,便能轻易发现有大量商家正在出售这种软件。“网文写作辅助软件”“自动写作软件”和“字段拼凑软件”等门类众多,价格则从10元到2000元不等。


经过比较后,腾讯娱乐购买了一款售价为100元的“写作神器”。据卖家介绍,该软件主打的功能有两个,第一个针对写作辅助,只要在软件内输入关键词,软件就会同步采集,抓取各种文学字段以供用户参考借鉴。例如,当腾讯娱乐输入关键词“女人”,软件就自动输出了十余条生动的文字描述。



经过查证,几乎所有自动生成的描述都摘自公开发表的文献,既有网文也有国内外名著,比如,“这时她己经长成了一个颀长、俊美的少女。她的脸庞是椭圆的、白皙的、晶莹得好像透明的玉石”,摘自杨沫的《青春之歌》。而“她面貌上修整的线条,还带有一种高贵的气概,纵然经过痛苦的和疾病的可怕的蹂躏,还没有把它完全磨灭掉”则摘取自法国作家乔治·桑的《安吉堡磨工》。


软件的第二类功能更加强大,被称为“标签模块化写作”。网店卖家号称这是一种可以“完美规避”版权纠纷的写作方式,软件已经将各种文字片段以标签模式生成。用户只需要对这些标签模块进行组装,软件即可通过复合结构产生“超过天文数字的变化”。


腾讯娱乐随即在软件中打开了标签模块,在面板中点击了“玄幻场景”、“古代男子气质”、“古代女子装扮”等标签,稍作加工,便生成一段辞藻华丽的玄幻网文:“罗什河边,一个文质彬彬温文尔雅的男子,明眸俊美的他来自九星峰,身穿素软缎袍子,束着长若流水的头发,他遇到了一位妍姿俏丽的女子,着牡丹团花薄烟纱上衣,织金缠枝纹襦裙,腰封羊脂白玉穿绣玉兰花的靴丽,瘦弱不经风。”



随后,腾讯娱乐还尝试通过这款软件创作出一篇玄幻小说的大纲,操作也并不复杂,在完成了主题类型、角色概况和情节桥段等几个部分标签的设定后,单击确定,软件随即就生成了一部将近2000字的“小说大纲”,整个过程则用了不到1分钟。卖家告诉腾讯娱乐,“熟练用户写作小说可达每天8000—30000字。”



同时,该软件还具备同义词转换功能,用户可以将“借鉴”到的词语进行同义转换,既能保持句子原意,又不用担心完全复制,“不论是写小说,还是写论文,都不用担心查重率的问题。”卖家信誓旦旦地保证。


“写作神器”研发门槛有多高?

基础好点的大学毕业生就可以做


“网络写作软件”真实情况有没有卖家描述得这么神奇呢?


腾讯娱乐使用软件进一步探索发现,该软件的关键词搜索功能基于的数据库,其实并非全网实时采集,而是由软件服务器统一提供定时更新,由用户下载已经归类好的数据包以供本地搜索,因此内容相对比较局限。



用户也可以按照规则为自己建立本地数据包,例如,如果你想建立一个“三国”的数据包,就可以在网上搜索一段关于三国的文字复制粘贴到相关文件夹里,下一次使用该软件时,输入“三国”两个字便会有相应的字句弹出。


而关于卖家口中的“标签模块自动化写作”,其实也并非完全智能,腾讯娱乐尝试往软件中排列了一段文字标签,随后由软件自行“续写”,得到的结果并不尽如人意,文章大部分都显得逻辑不通,字句也很零散。对此,该卖家尴尬地解释道:“电脑写作属于人工智能技术,目前还属于半智能的阶段。”


为了解读这类软件的工作原理,腾讯娱乐采访了IT专业人士,对方查阅之后表示,其实所谓的“关键词同步采集”其实就是一种基础的检索功能。“软件先抓取网络素材,并分析提取描述对象,建立关系。用户输入的关键词就是描述对象,然后软件便可以反馈出相应描述文本。”


而关于“标签模块写作”,“应该就是由软件工程师设定某个程序规则,在这个规则范围内,软件对海量素材进行挑选。然后再把这些文章素材打碎,打上细致的标签,最后再通过算法进行文本的组合。”就整体而言,这类软件的技术门槛并不高,“基础比较好的大学毕业生应该就可以做。”


为何网络写手频频使用写作神器创作?

有些人以为花钱买软件就能用


“大风刮过”接受采访时曾透露,称网文圈内使用此类软件写作的人并不鲜见,有些写手就借这个软件,以为自己花钱购买的软件就能用,并不知道会涉及抄袭。”


毋庸置疑,“写作神器”是市场大环境下的自然产物。编剧于立朋告诉腾讯娱乐,如今网文作者间的竞争很激烈,“虽然大部分文学网站对签约作者每日更文数量没有硬性的要求,但是他们身上也背负着收藏数、点击量等诸多压力,断更就意味着掉粉儿,所以就很容易采取一些投机取巧的方式。”


目前,关于“写作神器”的争论很多,相当一部分人的焦点都集中在技术问题与道德层面的博弈:“写作神器”涉不涉嫌违法?该不该被取缔?在技术创造与抄袭乱象之间,我们似乎并不容易找到一个清晰的制衡点。


“写作神器”是否违法,该为网文抄袭者“背锅”吗?

海量“搅拌式”高仿拼凑,举证难


其实,绝大部分使用“写作神器”的作者们都会担忧版权问题,腾讯娱乐从软件开发者方面了解到,这类写作辅助软件的文学素材有一部分来自网络,另一部分则可能是软件工作室的付费购买内容或原创。


以腾讯娱乐购买的那一款“写作神器”为例,在软件界面就有一个用户自制模板的入口,用户可以联系软件方,将自己原创内容有偿提供给该软件开发组,作为公开素材使用,“所以只要使用软件得当,其实很多作者是可以据此盈利的。”不过,由于目前软件互动生态还未形成,这一部分的合法授权只占到数据库的很小一部分。


不同的素材来源,也决定了其在法律意义的判定。北京市京师律师事务所互联网企业法律事务部主任庞理鹏律师告诉腾讯娱乐,“很多人以为花钱买软件,买素材,因是已经付费的,就不涉及到侵权,但如果软件本身并未获得授权,付费并不能成为免责事由。”庞理鹏律师强调,如果使用写作软件写小说涉嫌抄袭,那么软件的开发者和销售者均应承担相应的法律责任。


实际上,现行著作权法对一些抄袭与剽窃的界定并不清晰,对于这类涉及网络文学、互联网科技的软件是否构成抄袭,界定起来的难度更大。“一方面被拼凑的片段原文是否受著作权法保护,即是否表现了一定的独创性,值得探讨。另一方面,文章采用 ‘搅拌式’高仿手段,海量拼凑其它文章,找出相似片段出处是一件很费时费力的事情。”庞理鹏律师解释。


3月20日下午,“北京影视著作权专家鉴定委员会”在2017春季北京电视节目交易会上正式揭牌。鉴定委员会由影视专业人士和法学专家组成,目前已确定首批专家26名,包括法学专家14名,主要任务即为接受法院委托鉴定比对影视著作权抄袭案件,维护知识产权的合法权利。


虽然委员会目前还未发布可执行的量化标准和适用于哪些法律条文,但资深媒体评论人李星文认为,这填补了影视著作权司法鉴定的一项空白,标志着泛滥成灾的影视侵权终于有主持正义的权威机构,必将对我国影视文化产业的发展产生深远的影响。


机器人都能写新闻稿了,“大数据写作”未来是否行得通?




按照惯性思维,不论是“写作神器”,还是单纯的抄袭纠纷都要诉诸法律才能最终解决。但在接受腾讯娱乐的采访中,北京大学中文系副教授邵燕君却提出了另一种思考。


“现行《著作权法》是一部主要以纸质出版的知识产权为保护对象的法律,而如今文学生产机制以及各个方面发生了很大变化,法律相对滞后,它不可能迅速跟上网文发展的步伐。一些法律界人士对网络创作不太了解,只能参考从前纸质出版的案例来判断,有一定困难。”邵燕君认为,单纯从法律角度来思考这个问题是不够全面的。


邵燕君说,日本后现代文化研究者东浩纪曾提出过一个“数据库”理论,今天的网络文学创作,其实就是一种“数据库写作”。“网络文学是类型文学,其实本质上就是对一个公共数据库的提取,各种 ‘梗’、各种桥段经历了漫长的积累过程,在这种创作方式中,创作者共享一个数据库,原创和二次创作是不可分的。”


因此我们可以理解,在这种创作方式下,一些作品产生抄袭纠纷,乃至“写作神器”的产生,都是文学进入网络时代之后“大数据写作”趋势的表现之一种。基于这样的理念,北京大学中文系在读博士肖映萱提出,用写作辅助软件来填补文学作品的细节,或许是一个值得推敲的问题。


“比如说,作者写到这儿该有一段雪景,他在写作软件里输入 ‘雪景’的关键词,就会出现大量的之前的作者已经完成的雪景描写片段,甚至比他自己写得还好,那么他有没有权利不绞尽脑汁避开前人的硕果,而让机器代他完成呢?如果把这种假设推到一个极端,在坚持做手工艺人的作者坚守原创性的同时,想要成为大工业生产流水线上一枚齿轮的作者,是否有权利使用机器呢?”


肖映萱设想,或许可以试图给一部作品打上类似“本文细节由写作软件完成”的标签,并让愿意接受这个标签的读者去消费它;编剧余飞也提供了一些类似的思路,例如在软件内添加文字引用来源的标识,甚至为机器写作的内容也附加版权,“总之人工智能是科技发展的必然产物,我们应该规范它,而非打压。”


(文/曾妮 责编/杨小羊)


收藏 已赞