流程图的排版规则(共3篇)
本文中我们说说汉字编排的问题。
先要说一说汉字与拉丁字母的区别,字母是一种纯粹发音符号,每个字母本身并没有意义,单词的意义来自于这些字母之间的横向串式组合,而汉字的组字方式是以象形为原始基础,也就是每个字都具有特别的意义,一个简单的字可能在远古时代就代表了一个复杂的生活场景,因而它也是世界上最形象的文字。两者之间的阅读方式和解读方式都有本质的不同,因此,汉字的编排不能照搬英文的编排方式,它们两者之间在编排上有一些客观的区别。首先就是同样字号的实际大小不同,英文因为都是字母,字母的构成结构非常简单,一般在印刷上3号大小的英文都能清晰可辨,而汉字因为结构的复杂,在印刷上5号字已经接近辨认极限了,因而在设计时汉字因为要考虑可阅读性,在设计中就不如英文的字号大小灵活多变。还有英文字母线条比较流畅,因为弧线多,所以画面容易产生动感,这一点上比汉字生动多变。
第二就是英文编排容易成“段”,因为英文每个单词都有相当的横向长度,有时一个单词就相当于中文一句话的长度,单词之间是以空格做为区分,所以英文在排版时,哪怕是一句话,也大多做为“段”来考虑编排;而这点中文就完全不同,中文的每个字占的字符空间一样,非常规整,一句话的长度在一般情况下是不能拆成“段”来处理,所以中文在排版的自由性和灵活性上比不上英文,各种限制严格得多。虽然现代设计中有大量的对汉字进行解构的实验作品和商业作品,但总体来说,还是不能大量推广,毕竟,这种实验牺牲的就是人们习惯的汉字阅读的方便性。汉字的整体编排容易成句、成行,视觉效果更接近一个个规则的几何点和条块,而英文的整体编排容易成段、成篇,视觉效果比较自由活泼,有更强的不连续的线条感,容易产生节奏和韵律感。
第三就是英文的篇幅普遍比相同意义的汉字的篇幅要多,在设计时,英文本身更容易成为一个设计主体,而且因为英文单词的字母数量不一样,在编排时,对齐左边那么右边都会产生自然的不规则的错落,这在汉字编排时不太可能出现的,汉字编排每个段是一个完整的“块”,很难产生这种错落感。
第四,汉字的编排规则比英文严格复杂得多,比如段前空两字,标点不能落在行首、标点占用一个完整字符空间,竖排时必须从右向左,横排时从左向右等等,这些规则也给汉字编排提高了难度。而英文段落在编排时只能横排,只能从左向向,段前不需空格,符号只占半个字符空间,这给英文编排提供了更大更灵活的空间。这些区别在设计时都需要特别注意,不要照搬英文的排版模式来编排汉字,处理不好就会不伦不类!
那么对于汉字,究竟应该以一种什么样的原则和原理来进行编排才能使字、句、段、篇看起来美观清晰呢?本人在实践中,有一些经验可以拿出来与大家商讨,我在进行汉字编排时一般遵循的流程是:理解――分类――粗排――精确细排――校对。
1、理解
在进行文字的编排之前,首先要理解文字的内容。我见过很多设计师只注重
版式美现而不关注文字内容,把文字一拿到手就开始编排,从不考虑文字在说什么,他们的原则是文字一定要服从于版式需要。这是不正确的设计方法,对于一篇文案稿,如果我们不去理解它的表述内容,就很容易本末倒置。
一个标题,究竟用什么字体?用多大字号?横排还是竖排?这些是由整体版面气质和文字表述的内容所共同决定的,而不是按我们的惯性思维理解,标题一定要大,要突出,要用粗壮的字体。我们要深刻理解文字到底在说些什么,才能为我们选择字体字号提供依据,才能让文字的视觉感受与表述内容保持统一,才能为我们选择合适的插图提供指导方向。当然这种理解不是表面性的理解,还是真正吃透它所表达的意思,有时一些文字的意义是指东道西的,表面上是说这件事,其实它真正想表现是却是另一个道理,这就需要设计师有较强的理解能力。
2、分类
分类也就是把我们理解的文字段分成几个层级,并为其分配相应的占用空间和大致的视觉位置。谁是主标题,谁是广告词,谁是副标题,谁是内文,内文的组成结构是怎样的,是否需要进行视觉归纳或者是内容归纳等等,把这些问题搞清楚了,我们就可以为把这些文字分类成几个层级。
第一级是最重要和突出的,比如主标题、广告词、副标题等,第二级是对第一级的辅助说明或者是次于第一级的,比如内文和某些特别需要强调的电话号码等,第**是最次要的,比如跋、通联、页码、旁注等等,一般情况下分成三个层级就足够了,但有时会有一些很专业的技术图表和技术参数类的文本编排就另当别论了。需要特别说明的是,这种分类并不是绝对的,只是一个模糊、大概的基本轮廓,可以让我们了解到编排对象的在版面中的功能和意义。
最后要做的就是为各个层级的文字内容分配视觉空间,如果有插图配合的话,应该同时考虑插图和文本的空间占用(在这个过程中,最容易出现的问题就是,很多设计师喜欢先把插图定位得很死,把空间都计算好了,在编排文字的时候发现文字的空间不够,这时只能到处找多余的空间把文字硬塞进去,或者牺牲文字的字号大小来妥协,最后的效果就是到处都很挤,到处都不合理,这些对于新手来说要特别注意,文本的容量和插图的容量一定要同时考虑,在有必要的时候一定要对插图的空间进行调整,不要舍不得,整体效果永远都要比局部的效果重要)。
这里的空间分配的原则就是:每个文本元素都一定要有相对独立的空间,要让它看起来本来就应该在那儿,那块空间本来就是为它而留下的,而不是让人感觉是没有地方放了硬塞在那儿的。这是一个考验设计师整体调控能力的过程,因为空间是固定不变的,而每个元素之间又是互动的,A元素的空间多一点就意味着另一个B元素的空间就会少一点,那么如何让其占用空间均衡合理,要需要从版面美感、视觉流程、表述内容、版面风格、阅读习惯等多方面去考虑,千万不要过早为它下定论,多实验几次才能找到最佳解决方案。
3、粗排
经历了前面的过程,设计师心中应该已经有了一个初步的构想,粗排的过程就是把这些构想视觉化,以形成一个基本的编排风格,这个过程仍然是一个创作的过程,是对前面提出的编排构想实践和检验的过程,主要是检验各个文本元素占用空间的情况是否合理,(这里要特别注意的一点是,现在已经是在做成品了,因此要随时把自已调整到做成品的状态上来,成品的实际有多大,有时在电脑上
体现不出来的,要以实际的印刷经验来判断文本的大小是否合理,是否适合正常的阅读习惯)。
粗排主要是针对以下几个方面来进行:
A、对于内文,如果篇幅过长,应该考虑为其分栏。
分栏的方式有两种:一种就是把整个篇幅平均分成几个相同容量的段块,另一种就是根据文本内容的结构,以自然段为基础进行分栏,也就是每一段分为一栏,这种分栏方式能产生比较灵活自由、错落有致的视觉风格,但不是所有的篇幅都可以这样来分,它只适合于自然段比较明显均衡,段落数量不多,各个段之间的文本容积相差不大的条件下才可以实现。分栏的另一个要注意的地方就是栏宽的确定,一般来说,15-25个字的栏宽视觉效果比较适舒,超长或超短都会引起阅读的不方便。
B、字体的设置:
字体的问题牵涉很广,由于篇幅有限,在这里我也只能简短介绍一些实践过程的经验与大家共勉。首先要明白的一点就是:不同的字体有着不同的性格和气质,也就是说字体是有生命的。许多设计师对使用字体很迷茫,不知道什么情况下该使用什么样的字体,其实这就
第一文库网是没有去真正关注字体性格的结果。
现在电脑上的字库五花八门,基本上我们所需要的字体在里面都能找到,但似乎选择的余地越大情况却越糟糕,各种字体出现在不应该出现的场合已是司空见惯!所以我们要学会区分各种字体的适合范围,一个基本原则就是字体的气质与版面的气质是否吻合?比如说楷体,楷体是一种非常经典的字体,经过一千多年文明和无数书法大师的不断锤炼,已经非常成熟了,每一个字都经得起推敲,具有很强的文化气质,因此在做具有文化感和传统味的设计中可以使用。
宋体也是一种历经几个朝代的字体,被前人们修饰得无可挑剔,端庄秀丽,有贵族气质,还有仿宋体,刚柔结合,精致细腻,很唯美的字体。黑体是一种现代字体,刚挺稳重,有力量感,很醒目,但稍嫌笨重粗糙,但后来发展出来的等线体却非常精致耐看,很有现代小资的感觉,低调却不粗俗,且自成一派。
但有些字体在设计中却尽量少用或避免使用,比如文鼎的新字库里面的稀奇古怪的字体,非常粗俗,层次很低,然后就是综艺体、中行书、隶书之类的电脑字体,粗糙难看,气质很差。
真正经得起推敲的几种字体是:宋体(标宋、书宋、大宋、中宋、仿宋、细仿宋)、黑体(中黑、平黑、细黑、大黑)、楷体(中楷、大楷、特楷)、等线体(中等线、细等线)、圆黑(中圆、细圆、特圆),这些字体是一些标准的基础字体,虽然普通却很耐看,一般内文都使用这些字体。
当然,也有一些未列入进来的好字体,比如方正繁秀丽体和汉鼎的繁黑变,我就觉得非常不错。好的字体要用好的表现方式,对于每一种字体的挑选,一定要根据版面传达的内容和气质进行对照选择,不要带有个人喜好,许多平常不用的基础字体要尝试着去用,这样能加深对字体的理解,还有就是参考好的设计作品,看他们是如何使用文字的。总是就是不要乱用,要有切实可行道理,最关键就是一定要有视觉美感。
关于字体,还要补充一点,书法字体和手写字体是对字体过于雷同的一种好的解决方法,某些特别的版面上,使用这种很自我的字体能让版面产生灵气和个性。
C、字号大小的确定。粗排过程中,每个层级的文本字号应该基本确定,这对于形象画册、书籍装帧设计来说尤为重要,因为这种多页的设计物需要在文字
上有统一的视觉风格,每个层级的文本元素应该在不同的版面上保持相同或统一的`视觉性格。字号的大小确定需要有三个依据:一是各个层级元素之间的对比关系,a应该比b大多少,c应该比b小多少,应该要把各个层级之间的轻重关系体现出来。二是版面整体比例关系,也就是让文字突出但不唐突,弱化但要可见。三是成品的视觉效果,这是最重要的,比如一段内文,在报纸广告上可能8号至10号就足够了,但在海报招贴上,因为阅读距离的不同,可能需要24号字以上才能看清楚,而在形象画册上,6号至8号字都能看得很清楚,10号字都已经感觉偏大了一点。所以根据不同的成品媒介考虑不同的字号大小是非常重要的,千万不能依赖电脑屏幕的显示效果做为最终依据,要经常培养对字号大小的敏感程度,在一个经验丰富的设计师眼里,8号字和9号字的区别是非常大的,它们代表着完全不同的表现力。
总之一点,字号的大小是一种固定物理尺度,在设计中不能以单纯的感性观察作为确定依据,而要同时加入理性经验和成品概念来作为参考的依据。
另外要注意的一点是字体的不同也可能对字号大小的造成视觉偏差,一般来说,字符的占用比较满的字体(如黑体)在同等字号情况下看起来偏大,反之(如楷体)则偏小,这些在不同字体混排时经常出现,需要对其进行视觉修正,一般可以加入正负0.1-0.2的修正值就可以解决。
在编排时,字号的大小级数不能出现太多(除非你在刻意创造某些特殊视觉效果而需要进行混排),最好每个层级只使用一种字号大小,对于同一层级的不同隶属关系的文本,可以用字体进行区分,否则字号级数过多,将造成整个版面的杂乱无章。一般来说,第一层级的字号大小与第二层级的大小区别要比较大,而第二层级与第三层级的字号大小差距应该要小一点,这样可以清晰地体现出各个层级之间的区别。
D、字距和行距的再设计:
这个问题是很多设计师都忽略的问题,所以要在这里重点说一说。
为什么说“字距和行距的再设计”而不是“字距和行距的调整”,因为这里面的变化如同中国古代的八卦阵,复杂多变,不同的字距和行距设定会产生完全不同的视觉风格,已经可以说成是一种“再设计”。看到过很多设计师在进行文字编排时,直接使用电脑默认的字距和行距进行排版,花了大量精力在字体和字号大小或者段落形状上做文章,却完全忽略或者不重视字距和行距的再设计,以至于最后总是不得要领,结果不尽人意。汉字是方块字,每个字的占位空间完全一样,所以编排中非常容易出现呆板、沉闷、粗糙的视觉效果,解决这个问题的法宝就是字距和行距的调整。
如何让一段文字看起来精致、清晰可辨?不单单是字号大小的问题,而是每一个字、每一行字、每一段文本、每一篇章的上下左右的空间间隔距离是否合理。一般来说,字距的确定是由字体结构来决定的,因为每种字体对字符的占用空间是不一样的,比如楷体,结构比较自由灵活,对字符四边的占用率比较小,所以它所要求的“字距”也相对较小,字距太宽的话视觉效果就会散,阅读起来很吃力。而黑体和宋体则对四边的空间利用率很高,字符很满,因此它所需要的字距空间就比楷体要稍微大一点,才能让阅读者感觉舒适。在正常情况下,电脑的默认字距都偏宽,应该适当把字距调小一点。而行距的设计,则最能体现一个文字篇章的气质,汉字的行距设定一定要比字距大(除非你纯粹在追求一种特殊效果),行距最小应该在字高的50%以上才会看起来舒适,才能让“行”的感觉出来。
单个汉字在设计中是一个个“点”,汉字的编排就是把这些点连成我们需要的
线、面、形体,让它为设计服务,至于是让它成为点还是线或者是面,就完全由字距和行距所决定,有时我们在做一些比较大气的版面时,为了寻求一种视觉张力,会把文字行距处理超常地宽或窄,以加强每行字在设计版面中的作用力,充当“节奏线”的概念。有时也可以夸张字距,让字距超常地宽,让文字在设计中起到“点”的作用。
总之,或严谨传统,或反叛突破,字距和行距的再设计可以为版面提供更加灵活、富有感染力的表现形式,诸位多多试验就能体会其中奥妙。有一点需要补充的,不要牺牲可阅读性作为代价!
E、对齐:
汉字编排中的“对齐”是让人头痛的事情,有时为了让一个标点符号避开行首行尾,就要对整个段落进行大调整。对齐主要是指头尾对齐、段落对齐,一般来说,一段文字要想让它看来整齐划一,最好让标点不要在行头和行尾出现,这样可以保持文字段的完整性,当然调整起来是很吃力的,但就我的经验来说,有时候我为了对齐一行字,甚至会把所有的文字都打散了来重新进行微调。
因为电脑的自动对齐命令是基于一种相同的定位数值,而不能考虑到不同字体和字号之间的视觉偏差,设计师就需要对这些视觉偏差进行修正。设计师要具有这种严谨的编排习惯,对每一个元素都要斤斤计较,要做到分毫不差,才能有完美的作品产生。
F、气口的设置:
汉字的编排不象英文,英文有上标下标,有单词之间的空隔,所以排列起来感觉很有节奏感和韵律感,汉字每个字之间都太规则,所以排列起来沉闷无趣,要打破这种局面,就要学会设置气口。
所谓气口,就是能让大篇幅文本透气的空间,让阅读者有喘气的机会。一般来说,汉字编排中气口的设置在段前段后进行,气口的基本特征就是比正常的行距要大、与文字篇幅外围的大面积留白相连接、具有与空气对流相同原理的空白视觉通道。气口的设置根据设计的具体需要进行设置,篇幅小的时候一个气口就足够了,篇幅大而复杂时,则需要设置多个气口,尤其是抽象、枯燥的技术型文本块,由于层级关系复杂,更需要针对不同层级设计不同的气口,这样能缓和阅读的紧张感,让文本块看起来有节奏感和趣味性。要注意的是,气口的设置一定要在自然段或自然章节的前后进行,不要勉强拆分一个完整段来设置气口,这样会破坏文本本身的完整性。
G、文本块的趣味性:
汉字编排是很严谨的工作,但有时太严谨就会呆板,这时我们就要考虑文本块的趣味性,当然现在的电脑技术有很多的特殊效果可供我们选择的,比如首字下沉、文本阴影、文本绕图、任意形状的文本框等这些效果,就能让枯燥的文本块产生很好的趣味性。
但作为设计师来说,不能一味依赖电脑提供的程序化的效果,很多时候我们需要独立创造一些有趣的编排效果,以体现设计的某种特别意图。
比如让自然段之间有意识的错开、设置特殊的文本块的摆放角度、增加其它的可视化的效果、让文字同时具有图像的效果、颠覆传统的编排习惯等等,在设计的领域里,只有你敢想敢做,就一定会有出乎意料的收获!但不管何种趣味性的效果,最多同时使用两个,用得越多情况反而会越糟糕,要有把握的分寸,时时刻刻都要关注版面的整体美感,不要图一时之快而破坏整个版面,造成杂乱无章的结果。
H、文本块的外围留空:
文本块处理好了,放在哪儿?怎么放?这就牵涉到“外围留空”的问题。所谓“外围留空”,就是文本块或篇章本身之外的周围需要一定缓冲空间,以利于阅读轻松愉悦,就象是城市的一栋漂亮的建筑,如果周围不足一米的地方就是其它乱七八糟的建筑,那么这栋建筑将会魅力尽失,而如果它的周围有大片草地,它的魅力才能完整地展现出来。
文字编排也是同样的道理,如果一个经过严谨编排的文本块的四周全是挤得满满的图片、色块,那么这个文本块的美感就很难体现出来了,所以,在文本块的编排时,一定要在外围留有足够的缓冲空间。根据我的设计经验,一般比较舒适合理的留空,大致比例是:如果是从左向右阅读的文本块,那么它的左边边界到相邻元素之间的距离至少要保证3个以上完整字符的安全距离才能透气;如果左边相邻的是纸的边界,则一般需要6个字符以上的安全距离才能缓冲,否则就会有太“冲”和太“危险”的感觉。
文本块的顶部与其它相邻元素的空间也就应该保持至少3个字符的安全距离,而且越多越好。文本块的右边和下边对空间的需求相对较小,一般保持1个字符以上的安全距离就可以了。当然这并不是绝对的数值,许多情况下这些规则是可以被打破的,我们在设计的过程中应该多进行这种视觉实验,多揣摩好的设计作品的文本外围留空是怎样的,提高自已对这方面的认识,以后就会慢慢掌握留空的方法。
4、精确细排
这个阶段是非常重要而且是必须的,汉字编排是很讲究精确计算的,严谨完美的编排一定来自于精确的计算,这点在日本的设计中体现得尤为突出(日本文字的编排规则与汉字一样)。这个计算过程就是精确化、清晰化的过程。要计算什么呢?
在成品的习惯阅读距离内字的大小字号是否已经合理,各部分比例是否恰到好处,文本篇章在整个版面中是否和谐,各个层级的文字是否清晰明了,分栏的栏数和栏宽是否合理,各元素之间的距离是否安全得体,该对齐的部分是否已经分毫不差,字距行距看起来是否舒适,是否已经考虑过印刷成品裁切出血位后的距离,是否有需要进行视觉修正的部分,每个文本块的位置是否能完全确定下来等等问题。
这些问题都需要经过复杂周密的调整和计算,有些需要通过我们的眼睛进行判断,有些需要借助经验,有些需要校验数值,所以这个过程马虎不行,尤其对于文本量非常大的设计项目,一个地方出错,可能牵涉到所有的版面都需要调整。
5、校对
在期刊生产中, 期刊版面是按照编辑的思路处理期刊版面的手段或方式, 是从整体上反映期刊内容布局和编排形式的载体。从理论上讲, 应按照“两个统一”的原则设计期刊版面, 即整体性和连贯性的统一, 格式与节奏变化的统一。设计期刊版面时, 应针对科技期刊的发行特点, 根据装饰设计的基本原理, 对版面结构和各类要素的位置进行合理调整。在版面设计上, 要直观的体现采用科技期刊的易读性, 突出服务于读者的功能特点。关于文字、图表、版面以及封面等设计, 大到版面的整体布局、封面、目录, 小到文章的字体、字号、线条、底纹, 除了简洁明快的展示期刊内容以外, 关键是要突出科技期刊独特的创造性。然而这种传统的排版模型已经不能适应信息化时代的要求, 没有对内容资源进行多媒体呈现与集成化、结构化处理。
结构化是数字转型的核心, 结构化的首要环节是建立数字化标准, 知识分类的基本单元不再基于某一篇文章, 而是以文章结构以及词语为基本单元, 通过语义标签对文章进行结构化处理。所以, 结构化标准是数字化过程中的重要标准之一, 结构化质量的好坏直接影响数字化的水平。在科技期刊领域, 各大数字出版厂商和数字图书馆也开始规划构建用于文献存档的XML规范, 如NLM DTD、AIP (美国物理学会) 、BMC、Plos One等。另外, 文档结构化也是杂志社实现数字化编辑系统的核心, 数字编辑平台无论是在工作效率上, 还是在工作质量上, 都远远超过传统编辑出版模式。
1 数字出版与传统出版的比较
运用数字技术出版期刊, 就是我们通常所说的“数字出版”。与“数字出版”对应的是以纸媒为主的出版, 即“传统出版”。二者都做期刊, 这是二者的共性, 但出版方式有很大的差异:
从内容来看, 两种出版方式都是人类认知的记录。期刊作为出版物, 就是人类认知内容与认知形式的统一。严格来讲, 出版的内容必须通过一定的载体呈现出来, 由此形成的出版物就是人类社会发展和人类认知进步最有力的“证据”。它承载着不断演进的文化知识, 并且是知识传播的主要工具。
传统出版作为人文知识传播与发展的有效载体, 在人类社会发展中发挥了至关重要的作用。随着科技的进步, 数字出版逐渐进入人们视野, 并且一直维持在相对稳定的发展区间, 数字阅读营收呈现多元化。数字出版作为全民阅读的重要组成部分, 以其应用便捷和成本低廉的特点, 在服务文化民生上的作用不容小觑。
从出版流程和业务方向来看, 两种出版方式都是基于读者需求, 对知识进行积累、创作、筛选和加工, 以达到传播文化知识的目的。近年来, 出版技术的每一次革新都会带动整个出版领域进行大调整。数字出版就是出版史上的一次技术革命, 它有传统出版形式无以比拟的优势:
(1) 数字出版技术选题、组稿灵活快捷, 耗时更短, 促使编辑流程朝着在线协同编辑的方向发展。
(2) 出版物可直销;支持“无发行出版”, 网上书店精简了出版流程, 缩短了期刊的“生产时间”。
(3) 基于数字出版技术的期刊印制流程更加完善。
2 数字出版技术对传统出版业的影响
计算机网络技术的发展、信息流量的增大, 是数字出版技术形成和发展的主要载体。传统出版方式随着科技的发展不断调整, 衍生出数字出版方式。经过一段时间的发展, 数字出版技术逐步深入到出版的每一个环节, 并且带动整个出版行业的技术革新。
一般来讲, 数字出版技术囊括了存储、传输、显示等煤体技术, 如今又衍生出云出版、电子阅读、数字对象标识、二维条码、视觉分析、数字版权保护、语义搜索等多种先进的出版技术。新技术的融入大大缩短了期刊的“生产时间”, 提高了出版效率, 同时也进一步拉大了数字出版技术行业与传统出版行业之间的差距。并且新技术在数字出版领域的应用, 也衍生出一种先进的“全数字化生产流程”。该出版流程把以纸媒为主的知识传播路径, 逐渐升级到以网络技术、计算机硬件系统、数码成像、数码印刷四大主流传播途径, 基于数字媒介又衍生出跨媒体出版技术, 促进了跨媒体出版业的快速发展。
另外, 数字出版技术也带动了出版行业内部产业链的优化调整。数字出版产业链围绕设备制造商和技术提供商进行运作, 这是它不同于传统出版业产业链的一大特点是。除此以外, 数字产业链运用网路传播路径, 进一步简化了出版物流通环节, 使得读者足不出户即可获取全球先进的知识资源。而且出版从也传统的物流调整为信息流, 以双向互动模式取代了单向传输模式, 不仅强调产品的使用价值, 而且同样重视出版服务。
数字技术在出版业的应用, 是出版行业生产方式的创新, 是从产品到服务的优化调整。整个出版业机遇与挑战并存。
3 XML结构化排版的价值与意义
XML结构化排版工具提供文本结构定制服务, 而文本结构的灵活调整使得出版内容具有了双向操作、重用和可访问的功能。一次设计, 多次重用, 文本样式与文本内容分别独立, 只需简单操作即可在各种煤体上发布。除此以外, 内容的整合或关联操作使得资源能重复利用并且快速增值, 这充分体现出资源平台的灵活性。
3.1 提升出版效率
XML编辑器能与在线同行评审系统组合应用, 在保证文本完整的前提下提高文本整合效率。XML编辑能够决定页面布局, 并且能对文档工作路径进行全程跟踪, 通过所见即所得的方式进行内容的协同与组合, 从而提高版面的美观度。此外, 编辑器中有一套方便快捷的标引体系, 无论传统印刷还是数字出版, 都能提供相应的排版形式, 这对于节省排版时间、提高生产效率大有裨益。
3.2 实现数字资产管理
排版过程和结果支持多种储存形式, 如图片、视频、样式文件、XML文件等等。样式文件和XML文件还支持手机格式、HTML、PDF等多种转换格式。XML文件的高度结构化和高校表达, 能够链接当前主流数据库, 提供数据交换、图片处理以及音频图像的编辑功能, 以实现对多媒体资源的加工和整合。
另外, XML排版器还能从互联网上搜集所需信息, 同时提供数据转换功能。XML能够根据纸质出版物中的历史资源做出标引, 自动完成格式转换, 以提供碎片化且可重复利用的文本内容。还可链接专用数据库对这些资源进行存储和管理, 如在线服务、版权保护、版权重用、版本控制等等, 从而使科技期刊出版由传统的信息处理升级到对知识的管理, 从而更充分的满足读者需求。
3.3 便于数据的多元和多次发布
新媒介和阅读终端的涌现极大地丰富了读者获取信息、沟通和交流的渠道。新技术环境下成长起来的科技工作者几乎习惯并依赖于网络和新媒介, 这给传统科技期刊的发展带来了挑战, 科技期刊可持续发展的出路在于利用现有资源和技术整合与融合, 不断创新。以先进的生产手段———结构化文档为未来的内容服务提供必备的基础, 整合形成具有新价值和影响力的媒介, 打造集纸版、网络、手机、电信等为一体的复合型传媒产业集团。国际众多科学、技术和医学出版商已经采用“在线优先”的工作流程, 而XML的高质量输出和稳定性能够保证在线优先的出版策略, 提升信息的使用率。
3.4 提升产品竞争力
通过对章节内容、文献、图表、公式定理等自动编号, 建立参考文献和引用库等方式, XML文件保存了内容的结构和相关信息, 方便未来对内容的再利用和挖掘, 例如抽提题录信息、年度关键词和目次索引、生成知识库等。单就信息检索来说, XML具有自我描述性质, 可以提供语意层次的搜寻, 提高检索结果的精确率, 输出各种类型需求的内容, 目次、参考文献、公式、定理、插图、视频、页码等各类基础信息可实现任意形式的交叉引用。有效的数据管理, 可以保证内容的完全一致, 组织并发布不同形式的内容, 从读者的实际需要出发实现出版资源的多样化, 由专业出版向专业大媒体转变, 提升产品的竞争力。
3.5 为信息服务系统开发提供储备
现代出版形势下, 信息获取的途径以及信息服务渠道呈现出多元化的发展趋势。通过XML的可扩展性、数据与样式分离等功能可将碎片化的信息资源进一步整合并根据应用需求添加相应的宏包, 通过功能的拓展以满足使用者个性化的功能需求, 这一过程同时也拓展了信息服务的应用发展空间。标准的内容标注可以实现对内容特征的描述, 为检索各种内容资源提供基础, 使内容价值最大化, 为正确和有效地重用内容资源, 建立知识网络, 实现内容价值最大化提供战略储备。国外的实践证明, 传统出版向现代出版转型的过程中, 数字出版具有无可比拟的高时效、高智能化的特点, 科技期刊内容生产过程形成统一的数据源, 可避免重复劳动, 实现高频度重用。再辅之以格式化、标准化的信息格式, 能保证数据准确, 进而进行信息挖掘和组合实现多媒介、多形式的信息服务。
4 XML结构化数字转型的特点与优势
4.1 XML结构化的几个重要环节
首先, 采用新技术。即对传统出版资源进行结构化整理, 按照语义标准进行分类、存储。传统出版的电子版内容资源仅仅是服务、排版与印制, 只包含标题、正文等格式控制命令, 没有按照语义标准进行结构化整理, 也就无法实现语义检索与分类, 所以要采用新技术, 通过XML结构化语言对原始资源进行加工与整理。
其次, 改造出版流程。传统出版机构要大力开展网络出版业务, 或设立完全市场化的数字出版公司。数字化出版可以依托传统的编、印、发环节基础, 通过新技术改造, 加之与互联网整合形成新的产业模式。随着产业融合的逐渐深入, 在数字化浪潮的推动下, 原本严格区分的行业边界会愈发模糊, 内容提供商、技术提供商和渠道运营商之间的相互融合会越来越紧密。
最后, 出版资源数字版权授权解决方案。由于数字出版具有海量存储、搜索便捷、传输快速、互动性强、成本低廉等特点, 已经成为战略性新兴产业和出版业发展的主要方向。数字出版的特点也是数字版权面临的问题, 政府与企业应加快技术创新和标准制定, 为版权保护提供有效的技术手段;同时加大对数字版权侵权盗版行为的打击力度, 切实保障著作权人合法权益。
4.2 XML标记语言的特点
结构化的本质就是为文档建立一个描述框架, 通过标识符使文档任一部分 (任一个元素) 都和其他部分保持关联, 关联的级数就形成了结构。标识本身的含义与它描述的文档信息相分离。结构化文档 (Structured Document) 是由标题、章节、段落、图表、公式等框架结构组成。
XML正是具备这一特性的扩展性标识语言。XML文档是由XML元素组成的, 每个XML元素包括一个开始标记 () 以及两个标记之间的信息 (称为内容) 。XML允许无限的标记集, 各标记集并不表示如何显示, 而是表示其含义。例如, 可以将XML元素标记为标题、作者或工作单位, 等等。
4.3 XML结构化优势
最初, 设计XML的目的只是为了满足信息标准化的应用需求。以XML的格式存储文稿, 可实现以下功能:
(1) 以树状信息结构存储文稿内容, 可根据索引检索所需内容。树状存储结构就是按照父子关系节点存储文稿, 基于XSL模板批量存储和处理文稿, 结构脉络清晰, 易于检索。
(2) 围绕文稿内容进行存储和处理, 分离了一些没有价值的格式信息。每一篇文稿XML能通过树状结构存储文稿内容, 忽略排版格式信息, 可实现语义层面上对文档的定义。
(3) 只要设计统一的模板即可格式化为单独期刊具体页面格式。可以依据各期刊和图书体例的统一性设计转换模板, 实现XML统一转换。
(4) 有利于资料的共享和标准化。经过转换的所有文档, 可以方便地建立全文数据库, 实现内容资源的统一管理, 实现知识提取、知识比较、知识关联。并针对选题策划等各种任务需求实现资源共享, 实现个性化、片段化、碎片化出版。
(5) 可以方便地转换为任意的格式, 如HTML、PDF、RTF等格式, 实现多渠道出版。
5 XML结构化数字出版技术案例及流程分析
5.1 北大方正、玛格泰克数字出版流程分析
北大方正的书畅系统是以多媒体资源库为中心, 面向作者和编辑使用, 实现结构化内容的编纂、审校、管理和动态出版的全流程数字化出版生产系统解决方案, 支持出版社、期刊社数字内容加工的出版流程。整个系统平台在文稿的创建、协同创作、系统配置、控制和发布5个环节全面支持XML结构化数据标准, 支持从内容源头开始的基于内容对象的数字内容创作, 可生成多形态数字终端产品 (如PDF、EPUB等) , 实现内容一次制作多元产品发布功能。
该系统通过生产管理平台、模板设计、动态发布引擎、智能化客户端、交互式编排软件等模块, 实现从出版任务管理→交互式版式设计→基于XML技术的隐式结构化标引→多格式的内容发布等操作环节。该系统优点是可以处理期刊和图书等多种出版物, 在出版过程中构建编辑部、作者以及排版公司之间的协同与合作, 有效完成收稿、编辑加工以及排版等核心业务;缺点是价格偏高, 大约10万元/套, 多刊购买可以优惠。
玛格泰克制作流程首先是原文转换, 目前支持word (doc/docx) 、方正书版小样文件 (fbd) , 其次是CHTML结构化, 用于检查生成的XML文件的准确性, 主要是参考文献的准确识别、文中引用的识别和标记, 图表的处理等。其结构化流程如图1所示。
5.2 效益分析
玛格泰克稿件处理系统是期刊行业的主要平台之一, 为出版社、期刊社推出了整体的解决方案。目前已经在遍布全国的1600多家杂志社、十几家出版社得到应用, 研发了元数据提取服务, 用于网刊发布系统。完成了从方正书版排版结果 (FBD文件) 、word文件和Latex排版文件中, 自动获取每篇文章的基本元数据和扩展元数据, 并可以自动发布到网刊系统, 并实现参考文献的自动连接, 同时自动生成Pubmed、Linkout、XML数据。对非Magtech的网站系统, 其元数据自动提取系统可以形成Excel文件和XML文件, 用于一键式发布。优点是专业性强、价格适中, 约1500元/期, 相对于传统排版模式每期成本5000元左右大幅度降低了出版成本。
6 结束语
期刊的出版是一套系统性的生产流程, 各个生产环节虽然各自独立, 但也相互很影响、相互制约。以数字出版技术为主的出版流程是与跨媒体出版像匹配的放射状的出版流程, 而不是以职能分工为主的传统出版流程。出版业务流程再造的模式、时机都应该“量身订制”。
摘要:传统科技期刊出版在转型过程中面临的最大挑战是如何有效率地将各类型资源进行生产、整理、交换、推广及提供优质的信息服务。要适应市场环境和技术手段的进步, 就必须对传统的生产流程进行思考与再设计, 提高期刊的生产和信息发布效率, 增强核心竞争力, 实现新的战略发展目标, 这些有赖于有效的标准化的技术来解。因此XML结构化标引是传统出版的数字化转型核心, 科技期刊只有通过XML结构化转换, 才是真正意义上的数字化出版, 才能为实现数字产业化、知识集成化发展打下坚实基础。
关键词:XML,生产流程再造,标准化,数字化出版
参考文献
[1]沈俊, 缪淮扣.用XML实现基于大型数据库的结构化排版[J].上海大学学报 (自然科学版) , 2006 (05) .
[2]郭颖妤.XML在跨媒体出版中的应用[J].印刷杂志, 2004 (11) .
在政府各职能部门的大量业务信息中, 约80%的信息都与地理空间位置密切相关, 这些非空间数据资源都具有具体发生地的描述信息或标识信息, 例如行政区划、自然地理区域、地址、电话号码等, 这类信息是非空间数据资源与空间数据发生联系的关键所在。可以通过建设地名地址数据库, 提供地址匹配功能, 实现非空间数据的空间化, 简单地说, 就是给某一地址制定地图坐标, 从而使该地址所代表的地理实体在地图上的现实。
1) 分类
地名地址的分类至少应当包括行政区域地名, 标志物名 (兴趣点名) 、门牌地址及所在道路名称等类。
行政区域地名至少细分为市 (地区、自治州、盟) 级、县 (区、县级市) 级、乡 (镇、街道) 三级子类。
兴趣点名至少分为制造企业、交通运输和邮政、信息传输和计算机服务、零售和批发、住宿和餐饮, 金融和保险、房地产、商务服务、居民服务、教育科研、卫生社会保障和社会福利、文化体育娱乐、公共管理和社会组织等13个子类。
门牌地址至少分为XX街XX号。
所在道路名称为标志物名所在道路名称。
2) 描述规则
地名地址分三段描述, 第一段为行政区域地名, 由三级行政区域地名构成;第二段为兴趣点名或标志物名;第三段为门牌地址。第四段为兴趣点名或标志物所在道路名称;第五段为地理坐标信息。
地名地址编码规则如下:
行政区域名|标志物名|门牌地址|所在道路名|地理坐标
3) 地理位置坐标
地名地址地理空间位置表示采用其对应空间实体的中心点坐标表示, 坐标信息的获取可以从基础地理信息标准数据中采集或通过外业测量采集。
4) 数据加工
新疆维吾尔自治区地理信息中心已在数字石河子项目中建设完成了地名地址库的建设工作, 依据地名的命名规则和性质, 建立了以下5类地名数据:
*路名门牌:以所依附的道路实体名称和流水编号而获得命名的地名。如北四路路15号, 北三路路2-3号。
*行政区划:各级行政区划范围及驻地名称, 含市、区、街道 (乡镇政府) 、社区 (村) 。如下城区政府、天水街道、灯芯巷社区。
*楼宇地名:具有重大影响、知名度高或标志性的建筑物名称。如石河子市军垦博物馆。
*企事业单位:具有地理定位意义的企事业单位范围及名称。如学校、大型企业、事业单位。
*其余地名:含自然地物 (山、河) 名, 人文景观 (公园、水库) 名, 小区名等。如玛纳斯河、第十九小区等。
需要对该成果数据按《地名地址数据规范》的相关要求进行加工处理, 为地址匹配服务奠定数据基础。
5) 地名地址数据采集流程
1、收集并分析与地名地址相关现有影像及文字资料
A、现实性比较好的0.6米高分辨率卫星影像数据
B、当地各种比例尺地名库 (1:10000、1:50000)
C、地名办的地名数据 (民政部门)
2、分析并处理收集到得数据
对收集到的高分辨率影像或者大比例尺地形图进行几何纠正, 将其坐标误差控制在0.05m范围以内。
3、利用地理信息软件进行地名地址数据匹配
通过ArcGIS创建符合规则的地名地址匹配器, 将当地地名办收集到的数据与各种比例尺地名库数据做初次地名地址匹配。
4、数据采集
(1) 使用收集到的影像数据作为地名地址数据采集的底图, 在当地地名办与当地工作人员 (熟悉当地情况) 配合, 将地名地址数据 (地名办收集的无地理坐标) 中兴趣点名或标志物名与影像数据做一一对应, 技术人员通过ArcGIS等地理信息系统软件在底图上采点, 以确定地名地址的空间位置并赋予相应的属性。
(2) 使用收集到的影像数据作为地名地址数据采集的底图, 在当地与国土、测绘、建设规划或社区街道等相关部门 (建议最好具体到街道社区一级, 因为其工作人员对辖区更为熟悉) 合作, 将各部门手中所掌握的地名地址数据 (例:石河子市国土局各街道分局将石河子市各街道地籍图作为采集基础数据) 中兴趣点名或标志物名与影像数据做一一对应, 技术人员通过ArcGIS等地理信息系统软件在底图上采点, 以确定地名地址的空间位置并赋予相应的属性。
5、现场采集+野外调绘地名地址数据
对于底图数据上不能确认或者不熟悉的地名地址及无门牌号的地名地址, 应采取现场采集+野外调绘的方式进行采集, 采集完后将其与通过软件采集的数据进行合并处理。
6、地名地址数据的规范化处理
对于采集的地名地址数据需要规范化处理, 主要是包括属性项和数据的空间坐标系。需要规范化处理的属性项包括:标准地址名称、地址代码、地理实体名称、地址分类代码。这些属性的规范化需要参照《地名地址数据规范 (试行稿-20100125版) 》、《GB/T18521-2001地名分类与类别代码编制规则》以及规范中涉及到的其他规范。
摘要:地名地址数据是专业或社会经济信息与地理空间信息通过地理编码或地址匹配进行挂接的媒介与桥梁, 在数字城市建设的过程中起到了不可或缺的重要作用。
关键词:地理位置坐标,数据加工,数据采集
参考文献
【流程图的排版规则】推荐阅读:
辩论赛规则及流程10-30
法庭审判流程管理工作规则01-19
大学英语辩论赛比赛规则及具体流程12-12
湿法脱硫的工艺流程图09-21
学生管理系统的流程图01-26
拆迁的流程06-11
年会的流程12-14
转学的流程03-16
静脉采血的流程09-08
商品企划的流程09-10