业内信息

市场驱动下的出版内容动态重组模式思路

2016-04-29 来源:出版发行研究 万智

  摘要:本文对市场驱动下的出版内容动态重组模式思路进行了研究。首先,分析了我国出版行业和国际出版行业在相关领域的建设现状;其次,针对市场驱动下的出版内容动态重组模式进行需求分析,阐述了出版内容动态重组模式的发展趋势、服务模式、工具系统等方面的内容;最后,提出了一套出版内容动态重组模式的建设思路。

  关键词:出版内容动态重组模式 本体词表 动态重组

  一、引言

  随着新一代信息技术不断涌现与飞速发展,一方面,知识获取的渠道不断拓宽、方式更为便捷,读者对知识获取的精度、深度和实时性要求不断提高,尤其是在专业出版领域,读者的需求逐步向个性化、专业化发展;另一方面,伴随着硬件与移动网络布局的快速发展,出版载体和媒体形态日益丰富,带来了新的阅读体验,也驱动读者需求从被动接受到主动获取,从阅读载体及内容表现形式单一到全方位跨媒体阅读,呈现出任何时间、任何地点、任何活动、任何终端的4A个性化定制需求。

  动态出版是内容的增值开发,涉及用户体验问题。用户是市场的主要力量,因此市场驱动的研究具有合理性。以产品驱动市场用户的出版模式,编、印、发等出版流程周期长、生产过程低效繁杂,无法满足出版机构智能化、个性化与即时性的出版需求。以市场需求驱动产品生产的出版模式强调以用户个性化需求驱动内容动态重组,通过对内容最大限度和最大灵活度的聚合与重用,充分发挥内容价值,以生产多元化、个性化产品为目标,充分满足读者需求。

  因此,如何从以产品驱动市场用户的出版模式走向以市场需求驱动产品生产的出版模式将是当下出版单位出版转型过程中需要着重思考的一个问题。本文提出一套出版内容动态重组模式的建设思路,以此实践以市场驱动的按需动态重组的新型出版模式,发挥数字时代多元化知识组织优势,解决传统以本、篇、章为单位的内容难以按需组合的瓶颈问题。

  二、国内外研究现状

  数字出版的发展使得人们的阅读方式和阅读习惯发生着巨大变化,而人们的阅读需求又作用于数字出版产业发展的方向,促使许多优质的产品和服务应运而生,内容产品呈现数字化、碎片化和多元化的发展趋势。基于用户信息需求的数字出版模式主要表现形式为两种:一是个性化交互的用户模式,一是个性化定制的数字出版产品生产模式。

  第一种重组模式是从用户侧进行驱动内容重组,侧重于高度自动聚合重组,完全按照用户个性化需求进行内容推送。以英国广播公司(British Broad-casting Corporation,简称为BBC)为代表,BBC打造了动态语义出版的概念并推出相关技术框架和应用系统。该系统基于领域专业本体对内容数据进行语义标注,并采用关联数据技术实现数字内容的自动聚合、发布和重构,极大程度地满足了用户的多样化和跨媒体需求,提高了用户体验,并在2012年世界杯期间的网站发布中获得成功。BBC认为,这其中最大的挑战是应构建怎样的技术框架来实现对多样化需求组合的满足。

  第二种重组模式是从生产侧进行内容重组,侧重于根据不同的场景,基于预先定义好的内容组织框架进行内容组织。以IBM信息架构平台(IBM Information Architecture Workbench,简称为IAW)为代表,IAW以DITA(Darwin Information Typing Architecture)即达尔文信息类型化体系架构为核心的开源信息建模工具,通过对任务场景进行分析并建立架构主题之间的关系链接,以此为基础对文档内容单元进行有组织的编排,同时实现可视化的用户体验。该系统提供了较为灵活的内容组织框架,能够实现较为快捷的信息快速重组、文件管理和链接功能。但该系统的应用场景较为单一,主要适用于产品手册、规范文档、维护操作指南、业务操作指南等技术说明文档制作,对于面向其他场景和受众的出版物则很难进行主题界定与划分,应用于出版业的成本和难度较高。

  当前我国在出版内容动态重组方面的工作主要集中在内容碎片化加工、内容和形式分离等方面,针对用户个性化需求进行内容动态重组还没有看到成熟的方案。如方正书畅推出的协同编纂及动态出版系统,该系统基于XML结构化标准,以多媒体资源库为中心,通过动态发布引擎,实现一次内容制作,多元自动化发布。从技术上来看,这类系统重点通过结构化加工初步实现了内容的碎片化与结构化,完成了内容与形式的分离,但未能针对多元化的专业领域、读者类型和载体形态等制定相应的内容重组模式,无法实现知识内容的自适应聚合与重构。

  从上述分析可以看出,国内外出版业和信息服务机构在内容动态重组的应用水平上还存在一定的差距。

  三、市场需求分析

  (一)传统出版内容复用性不够

  根据中国互联网络信息中心(CNNIC)发布的《第35次中国互联网络发展状况统计报告》,截至2014年12月,我国网民规模达6.49亿,互联网普及率为47.9%。CNNIC对中国网民调查发现,网民数量大幅增长的同时,网民对电子图书及数字出版的需求也呈现旺盛之态。在“网民希望网络能更多地提供的产品或服务(多项选择)”项目中,提供“书刊类”的需求多年位居第一位。

  传统出版过程主要包括文稿修改、三审三校、定稿签字、排版、校对清样、版面设计、出胶片、印刷装订、出版发行等步骤,能够较好地保证出版物质量,但时间周期长、内容固化。国内传统出版机构已开始探索数字化转型道路,并完成了海量纸质内容的数字转化。但目前数字化转型工作主要集中于纸质内容的数字化加工方面,向市场提供的产品仍以同质化数字作品为主,海量数字内容的复用性不足。

  (二)内容需求呈现多元化发展

  工业和信息化部(以下简称工信部)发布的2015年通信业经济运行情况报告显示,目前我国移动电话用户规模将近13亿,移动互联网用户规模近9亿。中国新闻出版研究院2015年组织实施的第十一次全国国民阅读调查显示,我国国民的数字化阅读率首次超过了纸质阅读率。

  伴随互联网技术、智能终端的高速发展,内容资源在全球范围内加速流动,人们对内容的获取及应用需求更为具体和多元化,读者对出版物的内容构成、阅读方式以及传播时效都提出了更高的要求。以读者个性化需求为导向,整合并充分挖掘现有内容资源的潜在价值,实现多渠道、多媒体的内容聚合、重构与重用,同时缩短出版周期,快速完成个性化产品内容的生成,是出版业需要面对的重要课题。

  (三)出版动态重组需要系统化

  2014年,中央财政下达文化产业发展专项资金50亿元,比2013年增加4.2%,共支持项目800个。2014年新闻出版项目获中央文化产业发展专项资金支持21亿元,其中获得中央文资办支持的数字出版转型升级项目达77个,获拨文化产业发展专项资金6.27亿元。

  当前数字出版转型升级的重点方向主要为出版流程数字化以及内容分销平台建设。随着数字化技术的广泛使用,传统出版流程中的采稿、编辑、排版等多个环节都出现了相应的信息化工具,有效提升了出版机构的管理水平和运作效率。但在面向编辑内容高效组织和生产方面,即以内容提取为依托、以内容动态重组为核心的信息工具支撑还不足。

  四、重组思路

  (一)设计思想

  出版内容动态重组是在领域专业词表和领域本体的基础上,考虑不同专业领域的特点,利用已构建的专业知识体系,以及各种媒体资源及内容之间的关联性,根据事先设定的规则,将经过碎片化、格式化、结构化的数字内容,根据规则进行自动或半自动地重新组合,生成一个新的数字内容产品的过程。其设计思想如下。

  1. 出版内容动态构建服务

  出版机构通过重组策略配置、内容可视化调整等功能个性化生成内容产品并输出。主要功能包括:

  (1)重组任务查看

  查看管理员分配的重组任务;

  通过重组任务管理对应的重组内容。

  (2)重组内容管理

  按时间维度、完成状态查看用户相关的所有重组任务;

  根据管理员分配的重组任务要求创建一个新的重组内容;

  直接通过产品模板创建一个新的重组内容;

  对重组内容进行重组策略配置和管理。

  (3)重组策略配置

  通过重组策略配置功能设置内容动态重组的策略和规则。

  支持自定义选择知识抽取的领域词表、领域本体。

  支持自定义选择内容重组方式,如:根据篇章节、对象、主题词、知识分类等。

  支持自定义选择内容重组算法,算法依据内容主题、内容关联度阈值、内容提取范围、内容提取数量、时间跨度、产品模板、输出规则等形成多种组合形式。

  (4)可视化调整

  将重组的内容在界面上直观展现,并提供良好的交互性调整操作方式,提供对重组内容进行次序、位置等的调整功能。

  提供对经过动态重组生成的内容进行审核调整功能。

  提供对重组内容进行次序、位置等的调整功能。

  提供手动添加或删除重组内容功能。

  (5)多形态发布

  提供重组内容输出功能,并对接其他系统进行后续的处理。

  2. 内容动态重组管理

  出版机构管理者对重组相关业务进行分配和授权权限、重组策略管理、生产出来的各种产品以及对产品版权信息进行汇总。主要功能包括:

  (1)重组策略管理

  管理内容动态重组的重组策略,提供添加、删除、修改、查询等功能。

  (2)重组内容管理

  对重组内容的存储、使用、发布进行管理。提供重组产品的添加、删除、修改、查询等功能。

  (3)产品模板管理

  查看、导入和管理产品模板。

  (4)重组任务管理

  根据内容重组需要,创建、分配和管理重组任务。

  3. 动态重组策略解析

  对内容动态构建服务配置好的各种重组策略进行解析,生成相应的内容提取条件,并通过内部接口推送给多形态内容动态组配计算和内容动态构建服务进行数据提取、组配计算和输出时使用。主要功能包括:

  (1)基于领域本体的重组策略解析器

  对设定的重组策略配置进行解析生成基于领域本体的知识集合。

  (2)基于领域词表的重组策略解析器

  对设定的重组策略配置进行解析生成基于领域词表的知识集合。

  (3)基于内容属性的重组策略解析器

  对设定的重组策略配置进行解析生成基于内容属性的知识集合。

  (4)基于出版场景的重组策略解析器

  对设定的重组策略配置进行解析生成基于出版场景的知识集合。

  (5)知识集合生成

  对不同重组策略解析器生成的知识集合进行汇总计算,生成符合需要的知识集合。

  4. 多形态内容动态组配计算

  根据重组策略生成的内容提取条件,提取各种可计算的知识内容信息,并存入本地数据库中。对数据库中的临时素材数据通过多形态内容组配功能,对多形态内容关联计算、多形态内容重组推导、多形态内容噪音消除等处理后的内容进行组配,输出供编辑调整的数字内容产品。主要功能如下:

  (1)多形态内容抽取

  基于重组策略生成的内容提取规则或条件及知识集合,提取经过碎片化处理的与知识集合相匹配的内容素材。

  (2)权重计算

  对基于知识集合获取的存在重组临时库中的素材内容,通过重组策略设定的重组条件对素材进行权重计算,赋予素材一个主题权重值。

  (3)内容聚合

  对基于知识集合获取的存在重组临时库中的素材内容,通过重组策略设定的重组条件对素材进行按内容属性进行聚类输出。

  (4)内容排序

  对基于知识集合获取的存在重组临时库中的素材内容,通过重组策略设定的重组条件、主题权重值对素材进行排序输出。

  (5)动态组配

  基于设定的组配策略,将提取的多形态内容按照产品模板进行动态重组。

  (二)技术实现

  本文所述的建设思路充分利用了成熟的各类自然语言处理技术,基于领域和专业本体,对内容与形式分离后的结构化数据进行知识关系计算,并进行语义描述与表达;对基于内容标注生成的知识碎片,按知识关系和需求规则,应用关联数据技术和本体数据组织模型进行组织、聚合和关联构建,形成关联数据网络,进行存储和管理,并构建组配计算引擎以响应动态和多样化的请求,输出满足特定内容需求的、可灵活和个性化定制的、对跨媒体资源的内容碎片重构、重组和聚合之后的数字内容产品。涉及的相关技术包括自然语义处理技术、关联数据技术、语义数据的表达技术、语义数据库管理技术、语义数据检索技术等。

  1. 面向动态重组的知识集合生成

  由于单一知识提取策略技术无法满足跨领域、跨媒体、多类型知识抽取的要求,在内容获取过程中,准确性、一致性、专指性、时效性等方面存在一定的限制。为提高知识提取和内容素材提取的准确度要求,需要多种知识获取策略相结合。系统结合已构建完成的领域专业词表、领域本体等基础,对用户需求进行分析、划分及建模,从领域专业词表、领域本体等中提取符合要求的知识组件集合,以此为基础实现灵活、高效的智能化知识内容提取。

  2. 面向动态重组的实时权重计算

  系统基于多种策略提取海量结构化内容数据,通过多形态数据的内容关联计算构建了知识网络,为满足和提高内容动态组配的正确率,对形成的知识内容网络还需要根据内容的来源位置、时间范围、主题、人物等外部设定出版场景,构建权重计算算法。依此确定不同结构化的信息单元关联强度,按照由强及弱的次序选择最终的信息内容。

  3. 面向产品的内容自适应动态重组

  随着网络和终端技术的不断发展,各种数字阅读终端的种类日益丰富。与此同时,读者群体的广泛性和获取信息渠道的多样性也使读者需求呈现出多元化趋势。因此,相同出版内容在面向不同出版方向、专业领域、媒体形态、应用环境、读者类型、载体形式等场景时需要以不同的产品模式进行呈现。系统针对多种场景和多元需求,根据多种媒体资源及内容单元之间的关联性,以及不同专业领域的特点,快速完成个性化产品内容生成,从而提升用户阅读体验,切实满足读者个性化需求。

  五、结语

  以市场需求为驱动建立出版内容动态重组系统是出版单位竞争力提升的重要基础之一,本文尝试从内容生产端入手,利用多种信息处理技术设计了一套出版内容动态重组模式,辅助出版单位基于已有的素材,快速组织生产符合用户需要的数字内容,但是建立符合市场需要的出版内容动态重组系统是一个不断发展的过程,构建出版内容动态重组系统的方法不是单一方法,而是多种方法的综合。出版内容动态重组系统是一个开放的系统,纵观信息服务的发展可以看出,在今后几年里,信息服务存在较大的发展空间,很多新兴的技术和理论将在今后几年里迎来发展的黄金期,在国际和国内环境影响下,市场驱动下的出版内容动态重组系统建设将越来越成熟。

  参考文献

  [1]余旭,刘继红,何苗. 基于领域本体的复杂产品设计知识检索技术[J]. 计算机集成制造系统,2011(2):225-231.

  [2]陈继文,杨红娟,于复生,等. 基于多属性特性检索与推理的产品 MFBS 本体映射[J]. 机械设计与研究,2014(30):8-14.

  [3]姜洋,金天国,刘文剑,等. 基于本体的复杂产品设计知识优化集成[J]. 计算机集成制造系统,2010(9):1828-1835.

  [4]赵锋,何卫平,秦忠宝,等. 面向产品创新设计的广义专家群体知识获取[J]. 计算机集成制造系统,2009(9):1684-1689.

  (作者单位:武汉大学信息管理学院)

  * 本文系国家科技支撑计划“面向科技教育领域的动态数字出版标准规范研究”(编号:2012BAH88F01)成果之一。


































国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号