第一百九十八章 开卷数据方舟中台(1/3)

  【文学玩家】小说免费阅读,请收藏 全本免费小说【qbmfxs.com】

  既然陈竖已经睡下,林果决定自己去调查。

  “要证明《我的紫色芳香小说》是陈竖的作品,而不是卫胜男的,最快的方式当然是使用数据分析。统计出这两位作者早期作品中的高频词汇,语法习惯,以及标点符号等使用方式,再跟昨天在第二期短名单公示的作品进行比对——”

  “等等,你这倒是方便了,要找人开发系统,谁知道要多长时间。”

  说这话的同时,李带想到了万物皆可盘的技术达人赵盘,他倒是可以帮忙定制,但无论是文本的录入还是后续的统计,都要不少时间吧。

  正想着怎么加快进度的时候,林果说。

  “没关系,我这里有现成的系统。是开卷数据的内部服务。”

  听到这里,李带一惊。

  众所周知,开卷数据是华夏图书市场不可忽视的巨头之一。

  在出版行业里,有的公司靠原创内容挣钱,有的公司靠版权贸易挣钱,有的公司靠发行渠道挣钱,但是开卷数据这家公司不一样,它靠收集整理服务器里的数据挣钱。

  作为国内最大的图书市场零售数据连续监测系统的建立者,开卷数据拥有890多个地县城市,2000多家实体书店,1500多万种图书的3200多万条元数据信息,而且上面的数字每个月都在有条不紊地增加、整理、沉淀着。

  所以简单来说,它是全球最快、最全、最权威的华语出版书目信息库。

  有了这些信息以后,开卷数据既可以为出版业上游四百多家出版单位提供编辑选题、营销发行相关的数据支持,又可以帮助下游各个书店在采购、配货、上架、销售以及退货等环节,实现全方位、流程化和精细化管理。

  除此之外,他们还制作各种榜单,诸如《全国出版企业市场竞争力年度分析报告》《地区分类新书销售排行榜》等,报告是免费向全社会公开的,所以无论在行业主管部门,在业内各个同行,还是在广大普通读者中间,这家公司的口碑都很好。

  最令人讶异的是,这么家占据了行业龙头地位的公司,他们总部的员工,如果不算外包和实习员工的话,只有四十二个人。

  “这都能弄到,你路子还真是够野的。”

  “之前的服务器里用来运算的数据,都只是针对书籍的描述数据,也就是所谓的元数据,譬如书籍的标题、副标题、第一作者、第二作者(合著者)、第三作者(译者)、出版时间、出版方等等。这些数据虽然也很重要,在很多地方都能派上用场,但是开卷觉得它们的颗粒度还不够细,所以决定再进一步,深入到文本中,选择近十年内,出版的五十五万本重点图书,配合出版方做了电子版的录入工作,内部称之为「方舟中台」。仅对内部员工开放,使用公司配发的代理服务器才能登陆。我恰好有权限就查了查,里面就包括陈竖和卫胜男的书。”

 

本章未完,点击[下一页]继续阅读-->