文章正文

作家故事 写作心得 新书推荐 新手上路 征稿公告 写作素材 资源中心小说阅读归一云思

出版业通用数据交换“端交换方案”创作构想

时间:2023/11/9 作者: 全国新书目 热度: 20133
◎文/孟睿 丛磊

  社会信息化有着人类社会特定历史发展阶段中的技术、理论、认知和社会需求等诸多方面的背景及动因。在出版信息化的过程中,出版业不断发展创造着新的出版形态、出版流程管理模式和文化传播方式,推动了出版产业信息化的发展,开启了崭新的出版产业信息化时代。

一、“端交换方案”的设计方案

1.需求分析

随着出版产业信息化的推进,大量的异构系统充斥在出版各个阶段中,随着时间的推移,信息量越来越庞大,信息类型也呈现出多样化的特点。这就导致各种信息要么杂乱交织在一起,要么彼此分离、难以共享,导致大量的数据信息很难被充分利用,无法实现信息价值的最大化。

  面对大量结构化、半结构化或非结构化的出版信息,需要一种新的解决方案来支持异构系统间各类信息的传递和共享。出版产业通用数据交换技术重点实验室经过一年半时间的研究,已确定并验证了通用数据交换的关键技术在于如何实现“端交换方案+中间标准库”在交换云平台中的协同运作,即“耦合数据交换技术”,其通过依赖多个维度的参数和系统性的逻辑,将交换行为模板化、通用化,构建出交换双方的映射通道,从而实现异构关系数据库之间的数据传输。

2.概念解析

传统的软件设计模型常分为三层,分别为“业务模型层”“用户界面层”和“控制器层”,此种设计模型是将业务模型和用户界面的代码分离,从而使同一个程序可以使用不同的表现形式,在改进和个性化定制界面及用户交互的同时,不需要重新编写业务逻辑。而通用数据交换技术的“耦合数据交换技术”架构是在此架构基础上,将MVC架构与数据处理也进行抽象分离,实现数据交换整体流程与系统业务逻辑无关性,重新设计成三层并根据其功能区分代称为“端方案层”“耦合层”“云平台层”。

  “端交换方案”是应用在“端方案层”中,位于数据交换两端,负责数据的读写及应用系统的适配,通过指定客户端加载运行后用以处理数据内容和交换流程的解决方案。“端交换方案”中对数据类型、数据库交互规则、业务逻辑进行相应设定,数据发送方通过“端交换方案”设定的规则对数据进行抽取、清洗、处理、编译,从而生成“数据交换载体文件”,数据接收方则通过“端交换方案”对“数据交换载体文件”进行校验、解析、处理、存储。因此,“端交换方案”是交换端应用系统业务逻辑的继承和实例化。

3.结构分析

在过去的很长时间里,通过XML技术进行结构化信息之间的传递已经是成熟的方案并得到了很好的实践,XML作为一种可扩展的标记语言,是一种创建、设计和使用标记语言的工具集,是当前处理结构化文档信息的有力工具。经过研究证实,它也是“端交换方案”的理想编写语言。

  尽管XML格式数据支持当前大多数数据库的结构化数据操作,但由于数据交换过程中可能存在必要的业务逻辑,单纯基于XML语言的固定格式仅能作为结构化数据交换载体,不能完全满足含有复杂业务逻辑的大量异构系统之间的半结构化或非结构化数据的交换,缺乏“通用性”。而“端交换方案”的核心是XML文档,“端交换方案”借助XML结构化标记数据的基本特点,通过“中间标准库”搭建数据映射桥梁,使得半结构化或非结构化数据在经过数据转换和校验后具有了“类结构化”数据的可比性和可交换性。通过XML技术编写“端交换方案”的目的是利用标准的、与软硬件无关的XML语言,将业务单据元数据与业务单据逻辑按照规范结构封装在一个方案文件中,以保障两者之间的可靠联系。

  “端交换方案”由XML声明、根元素和元素组成,XML声明将“端交换方案”定义为一个标准的XML文档,并声明了方案的编码格式以及是否与外部其他文件存在关联;根元素和元素则是数据交换的主要内容,用来记录进行交换的具体数据以及它们在交换过程中需要遵循和执行的业务规则,主要分为“端方案标题”“业务单据”“业务单据逻辑”三部分。

二、“端交换方案”创作规则

传统出版行业发展至今已趋于稳定,不同出版社的业务细节可能存在差别,但大致的业务流程和流转的业务数据结构大同小异。数据交换要想实现通用性,首先“端交换方案”的整体结构就必须模板化,这就使得“端交换方案”需要遵循一定的创作规则。

  根据XML语言的结构特性,其主要构建单元是通过标识、定义、约束性、值域等一组属性描述的数据元素。下面基于数据元素的中文名称、元素定义类型、数据格式类型及其所代表含义的说明等几个方面,来描述“端交换方案”的创作规则。

1.“端方案标题”创作规则

“端方案标题”部分用于记录“端交换方案”的基本信息,包括它适配的数据交换双方的系统及版本,它的技术支持者,以及它交换数据的大致类型等,是“端交换方案”的身份识别标识,用以区分不同系统或同一系统不同版本的对应方案。其数据元素细目如下表所示:

  

  中文名称数据标识端方案编号定义类型 格式类型SimpleType xs:string SimpleType xs:integer端方案名称SimpleType xs:string端方案版本号SimpleType xs:decimal端方案提交时间端方案提交者ID SimpleType xs:dateTime SimpleType xs:string说明用于标识“端方案标题”分组创作端方案时系统自动分配的编号,端方案的编号相当于端方案的身份ID,用于识别、区分端方案创作端方案时由开发者填写的名称端方案的版本号,随端方案版本更新而变更端方案的创作时间提交端方案的用户的注册ID

  

  端方案提交者名称端方案提交者电话端方案作者ID端方案作者名称端方案作者电话SimpleType xs:string SimpleType xs:string SimpleType xs:string SimpleType xs:string SimpleType xs:string端方案使用说明SimpleType xs:string端方案更新说明端方案适用类型端方案执行标准号SimpleType xs:string SimpleType xs:string SimpleType xs:string端方案执行标准名称SimpleType xs:string端方案校验状态SimpleType xs:boolean端系统ID端系统名称端系统版本号SimpleType xs:integer SimpleType xs:string SimpleType xs:string端系统数据库类型端系统所有者ID SimpleType xs:string SimpleType xs:integer端系统所有者名称SimpleType xs:string端方案业务单据数量SimpleType xs:integer提交端方案的用户的姓名提交端方案的用户的联系电话创作端方案的开发者的注册ID创作端方案的开发者的姓名创作端方案的开发者的联系电话创作端方案的开发者对使用该方案的说明新版本端方案的更新修改内容特定端方案的适用说明用于校验本端方案的中间标准的标准号用于校验本端方案的中间标准的标准名称端方案的校验状态(0-未校验、1-校验通过、2-部分校验通过、3-未通过校验、4-未知)云平台中注册的端系统ID云平台中注册的端系统名称云平台中注册的端系统的系统版本号,以版本标识符“V”+主版本号+次版本号的形式记录端系统所使用的数据库的类型端系统开发者或版权所有者的注册ID端系统开发者或版权所有者的名称本端方案中参与数据交换的业务单据数量

2.“业务单据”创作规则

“业务数据”部分记录本次数据交换的业务单据信息和数据元素,实现交换双方的数据库之间、数据库与平台“中间标准库”之间的相互映射、节点关系及网络拓扑结构,异构系统的多样化数据只有通过映射关系调整和数值转换后,在数据结构、数据类型及中间标准校验上才具有一定的可比性。其数据元素细目如下表所示:

  

  中文名称 定义类型 格式类型数据标识 SimpleType xs:string说明用于标识“业务单据”分组创作端方案时系统自动分配的编号,端方案的编号相当于身份ID,用于识别、区分端方案

  

  端方案编号 SimpleType xs:integer业务单据序号 SimpleType xs:integer业务单据名称 SimpleType xs:string业务单据说明 SimpleType xs:string单据流向 SimpleType xs:string单据文件类型 SimpleType xs:string单据文件名前缀 SimpleType xs:string是否创建额外项 SimpleType xs:boolean表名 SimpleType xs:string创建语句 SimpleType xs:string字符集 SimpleType xs:string逻辑步数 SimpleType xs:integer用来区分业务单据,标记业务单据和对应业务逻辑用来说明业务类型该业务单据的补充说明单据流向状态分为:发送和接收单据文件类型分为:XML、JSON等,均以大写表示单据文件名前缀组成规则:发送方编码_接收方编码_业务单据名称可以创建的额外项包括表、视图、序列、触发、过程等:1-需要,0-不需要提取数据的表的名称,英文表名+中文表名,多个表之间用“丨”分割数据交换涉及的额外表和视图的创建语句该业务单据形成的单据文件的字符集对应的“数据单据逻辑”的步数

3.“业务单据逻辑”创作规则

“业务单据逻辑”部分记录数据处理过程的相关代码,该段代码是业务单据交换中必须执行的逻辑指令,可通过交换平台直接解析,不需要调用交换系统中内置的函数代码就可以直接模拟业务规则,实现对源数据的处理,既完成了数据输入输出过程中的各种触发,又保证了交换系统本身的完整性,在数据提取、存储的基础上丰富了处理过程,使其可以完成贴合业务逻辑规则的复杂数据交换过程。其数据元素细目如下表所示:

  

  中文名称 定义类型 格式类型数据标识 SimpleType xs:string端方案编号 SimpleType xs:integer业务单据序号 SimpleType xs:integer逻辑步骤序号 SimpleType xs:string逻辑步骤说明 SimpleType xs:string说明用于标识“业务单据逻辑”分组创作端方案时系统自动分配的编号,端方案的编号相当于身份ID,用于识别、区分端方案标记该逻辑步骤所属的业务单据标记该逻辑步骤位于所有步骤中第几步说明该业务单据逻辑步骤的作用

  

  

  “端交换方案”有唯一一个“端方案标题”,但可以有若干个“业务单据”,每个业务单据又可以有若干个“业务单据逻辑”,通过一次交换,完成两个系统间多业务、巨量化的数据传输。

三、结语

出版大数据的“大”不仅体现出了数据的巨量性,也包含了其数据的复杂性。出版业的大数据仅在产品的数据内容上具有行业一致性,其业务数据要具体到各企业,而企业的业务流程千差万别,使得出版大数据包罗万象。“端交换方案”在遵循业务规则的基础上为大量结构化、半结构化或非结构化的信息数据构建起映射关系,从而达到通用数据交换的目的,其创作遵循着一定的规则,也为信息技术普遍薄弱的出版企业提供了更多数据交换自助的可能性。
赞(0)


猜你喜欢

    推荐阅读

      参与评论

      0 条评论
      ×

      欢迎登录归一原创文学网站

      最新评论