知识产权出版社(简称“知识产权社”)由国家知识产权局主管、主办,成立于1980年,是集出版、印刷、数据加工和信息服务于一体的综合性出版机构。与行业内其他出版社相比,知识产权出版社最大的特色在于图书出版业务,占总收入的15%左右。
在知识产权产业链中,知识产权社也贡献着独特力量。在建社初期,我们就开始做知识产权相关的数字资源建设,形成一个大数据资源库,建成一个1200平米的大数据IDC机房。我们社有一整套信息化处理方案,并且自主研发了一些相关技术,例如机器翻译、可视化、数据挖掘、语义分析、人工智能。在应用端口,围绕现有的数据资源,我们社面向全社会提供数据信息服务,面向知识产权行业的创造、保护、维权和培训以及进一步的专利转让、运营、专业人才资讯提供进一步服务。
适应市场新需求的抽取式服务
知识产权具有很高的经济价值、科技价值、法律价值,受到创新型企业、高等院校和科研单位的高度关注。因此,随着社会不断开放,提供知识产权信息服务的机构越来越多。大家服务模式基本相同,就是建造一个数据库,运用电子出版的形式给用户提供知识产权相关的信息查询、应用服务。但是,这种服务方式在高速的社会发展中,越来越跟不上市场的需要,现在更多的服务方式应该选用抽取式。
那么,什么是抽取式呢?抽取式就是把数据、应用工具整合在平台上,完成各种个性化的数据挖掘和二次数据信息的制作生产,并且把这些数据直接推送到用户面前,从技术上讲就是把所有的数据以API接口的形式完全开放出来。API接口在市场上收益很好,它可以方便用户即时制成想要的东西,这些东西在大数据资源整合之后会形成二次资源,形成一种抽取式的应用服务模式。
知识产权出版社知识服务探索之路
什么才算是真正的知识服务呢?首先,知识服务是通过对信息内容组织、序化、检索和传递,满足用户获取特定信息需求的服务。其次,知识服务是针对用户特定知识需求问题,在经过信息分析、重组、创新、集成之后形成的解决方案。知识产权社从上世纪90年代就开始在电子化、数字化的过程中探索知识服务的运营模式。
上世纪90年代我们开始尝试把纸质的内容变成光盘,1992年在美国刻成第一张光盘。1995年开始做一些实验,1998年正式启动专利数据的文本OCR,现在能把我们全部3000多万件文献做OCR的扫描、加工、处理,形成文本化和代码化的数据。2000年开始通过网络平台提供相应服务,2012年我们实现了知识产权服务知识化。原来单一的平台演化出很多知识服务的产品,慢慢开始知识化服务的过程。
国际间交换的问题是知识产权服务行业比较好的数据加工内容,有很多数据有既定标准。我们在亦庄有一个数据加工的基地,有300多人在进行数据加工的工作。
在近些年的努力下,我们形成比较显著的成果。知识产权社拥有专利数据种类99种,包括国内还有全球的专业文献大约1.3亿件。除了专利之外,其他数据资源如期刊的源数据、商标、法院的判例、集成电路都进行了相应的加工和整合,并形成了很好的数据关联。
知识产权大数据服务系统
在近些年知识服务的过程中,我们重点打造的产品是知识产权大数据服务系统。这是目前唯一一个集成知识产权相关数据内容资源的平台,拥有知识产权数据最大的内容量。开发初期,这个平台的定位是以账号的形式来提供数据,运营两年以后,我们发现了账号销售的方式。最近几年,我们的产品API非常火热,订购人数非常多,并且我们可以按照用户的需求不断改进接口,同时把经过二次加工的内容直接推送给用户。比如说,用户订阅内容专利的情况,通过API就可以拿到数据分析报告。
知识产权大数据服务系统大概包括十几种检索查询的模式,其中包括专利查询功能。在知识服务端口,平台提供有关项目空间用户对自己数据内容推进项目类的搜索、排序、筛选、分组、标引以及统计分析的功能,这样就可以产生所需要的专题数据。在对外服务上,除了个人服务,平台还面向集团绑定IP提供各种服务模式。
平台最新实现了动态可视化的数据分析技术,一个动态技术图可以打包下载下来直接运用。平台里支持用户的自建库和行业主题库自定义的数据建设,到目前为止还存在一些争议。因为我们平台不仅提供大数据,还支持用户个性化小数据。很多用户本身就是专业的知识产权人和专业的研发机构,对自己的行业深有了解。平台在对小数据进一步加工以后,这个数据实际上已经产生了新的附加值。
在新开发的大数据商城里我们推出一种新的模式,客户登录平台,利用自建功能产生个性化数据,形成一些小数据,商城对数据进行运营。目前,我们签约了六七家做数据运营的机构包括我们自己建的专题库平台,这样就很好的解决了知识内容共享的问题。