信息检索作业

2025-05-10 版权声明 我要投稿

信息检索作业(精选7篇)

信息检索作业 篇1

1.在CAJ-CD规范中,符号“J”表示的参考文献类型是()

A.专著

B.论文集

C.报纸文章

D.期刊文章

正确答案:D

2.三次文献包括()

A.目录

B.索引

C.文摘

D.综述

正确答案:D

3.被称为“研究文献的文献”的是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:C

4.述评主要提供的是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:C

5.部首法作为印刷版工具书的主要排检方法,首创于()。

A.《中华大字典》

B.《说文解字》

C.《康熙字典》

D.《字汇》

正确答案:B

6.三次文献具有的特点是()

A.原创性

B.检索性

C.分散性

D.参考性

正确答案:D

7.下列哪项工具书不是资料性工具书()

A.类书

B.百科全书

C.年鉴

D.索引

正确答案:D

8.电子化的检索工具是以()的形式出现的。

A.数据库

B.资料库

C.电子版

D.印刷版

正确答案:A

9.循环衍生法的具体内容不包括()

A.定义衍生法

B.语素衍生法

C.语音衍生法

D.语境衍生法

正确答案:C

10.在CAJ-CD规范中,符号“CD”表示的参考文献类型是()

A.磁带

B.磁盘

C.光盘

D.期刊文章

正确答案:C

11.主要用来解释语词的意义、概念、用法的工具书是()。

A.类书

B.字典

C.词典

D.百科全书

正确答案:C

12.“民用!建设”中的两个叹号代表嵌入的字数是()。

A.2个

B.4个

C.0—1个

D.0—2个

正确答案:D

13.网页时间是指()

A.网页最终修改的时间

B.网页生成的时间

C.网页浏览的时间

D.网页初次修改时间

正确答案:B

14.高级检索的检索特点是()。

A.组配检索、清晰检索、限定检索

B.清晰检索、限定检索、模糊检索

C.组配检索、清晰检索、模糊检索

D.组配检索、模糊检索、限定检索

正确答案:D

15.下列哪项工具书不是参考性工具书。()

A.手册

B.图录

C.词典

D.年鉴

正确答案:C

16.一次文献具有的特点是()

A.原创性

B.检索性

C.综合性

D.参考性

正确答案:A

17.手册的基本特点是()。

A.侧重揭示文献内部特征

B.内容新颖,连续出版

C.著录内容标明出处

D.所收资料侧重基础知识,注重实用性

正确答案:D

18.二次文献包括()

A.目录

B.述评

C.手册

D.综述

正确答案:A

19.被称为“线索性文献”的文献是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:B

20.在CAJ-CD规范中,符号“M”表示的参考文献类型是()

A.专著

B.论文集

C.报纸文章

D.期刊文章

正确答案:A

21.()的突出特点是,以“字”为中心,形、音、义兼顾,历史地、全面地、正确地反映其演变和发展。

A.《新华字典》

B.《古汉语常用字字典》

C.《中华大字典》

D.《汉语大字典》

正确答案:D

22.清代康熙年间编辑成书的(),是当时权威的官修标准韵书。

A.《韵集》

B.《广韵》

C.《切韵》

D.《佩文诗韵》

正确答案:D

23.()完善了唐代以来韵书加注释、引文注出处的体制,确立了韵书作为“按韵编排的同音字典”的性质。

A.《韵集》

B.《广韵》

C.《切韵》

D.《声类》

正确答案:B

24.在中国辞书编纂史上具有深远影响的部首法,首创于()。

A.《中华大字典》

B.《汉语大词典》

C.《辞源》

D.《说文解字》

正确答案:D

25.()是中国古代最早的官修韵书,也是现存最早的完整韵书。

A.《韵集》

B.《广韵》

C.《切韵》

D.《声类》

正确答案:B

26.大规模查考汉语字词的代表性工具书是()。

A.《中华大字典》

B.《汉语大词典》

C.《辞源》

D.《辞海》

正确答案:B

27.中国辞书发展史上标志着辞书编纂由古代字书阶段发展到现代词典阶段,具有划时代意义的大型综合性词典是()。

A.《中华大字典》

B.《康熙字典》

C.《辞源》

D.《辞海》

正确答案:C

28.确立了字书释文先注音、后释义以及字义有序排列、释义列举书证的体例的字书是()。

A.《字汇》

B.《正字通》

C.《康熙字典》

D.《佩文诗韵》

正确答案:A

29.()是一部以解释汉字形、音、义为主要内容的大型历史性详解字典。

A.《新华字典》

B.《古汉语常用字字典》

C.《中华大字典》

D.《汉语大字典》

正确答案:D

30.《辞源》的本质特点是()。

A.实用

B.溯源

C.百科性

D.容量大

正确答案:B 论述题:(共2题 每题20分)

1.中国辞书体系形成的标志

正确答案:

(1)基础性、权威性汉语语文辞书已经形成系列;(2)汉外对照的双语辞书基本覆盖了所有实用语种;(3)学科性辞书基本覆盖了所有主要学科;(4)辞书的品种、类型多样化;(5)辞书的功能、效用特定化;(6)辞书的社会认知程度明显提高。

请给分:

2.创建个人资源管理数据库的好处

正确答案:

(1)可以个性化的揭示自己积累的文献信息资源;(2)可以对自己积累的文献信息资源进行多角度的检索和查询;(3)利用数据库中的超链接、对象嵌入等功能,可以将文献信息资源的出处链接到数据库记录中,也可以将积累的文献资源已对象包的形式嵌入数据库,使资源利用更方便。

单选题:(共30道试题,每题2分)

1.索引数据库主要提供的是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:B

2.被称为“线索性文献”的文献是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:B

3.书目数据库主要提供的是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:B

4.信息检索中的检索词可分为四类,下列哪一项不属于检索词的分类()。

A.表示主题的检索词

B.表示作者的检索词

C.表示分类的检索词

D.表示数据的检索词

正确答案:D

5.揭示文献内容出处的线索型工具书被称为()。

A.书目

B.索引

C.百科全书

D.类书

正确答案:B

6.在CAJ-CD规范中,符号“N”表示的参考文献类型是()

A.专著

B.论文集

C.报纸文章

D.期刊文章

正确答案:C

7.在CAJ-CD规范中,符号“M”表示的参考文献类型是()

A.专著

B.论文集

C.报纸文章

D.期刊文章

正确答案:A

8.三次文献具有的特点是()

A.原创性

B.检索性

C.分散性

D.参考性

正确答案:D

9.主要用来解释汉字的形、音、义的工具书是()。

A.类书

B.字典

C.词典

D.百科全书

正确答案:B

10.在CAJ-CD规范中,符号“CD”表示的参考文献类型是()

A.磁带

B.磁盘

C.光盘

D.期刊文章

正确答案:C

11.“中国???大学”这个检索词中,中间共嵌入了几个检索词()。

A.3个

B.6个

C.9个

D.不确定

正确答案:A

12.利用布尔逻辑检索技术来检索包含司马迁或包含《史记》的文章,输入的检索条件是()。

A.司马迁+《史记》

B.司马迁—《史记》

C.司马迁*《史记》

D.司马迁not《史记》

正确答案:A

13.循环衍生法的具体内容不包括()

A.定义衍生法

B.语素衍生法

C.语音衍生法

D.语境衍生法

正确答案:C

14.综述主要提供的是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:C

15.电子版检索工具的检索入口是()。

A.数据库

B.拼音

C.检索词

D.偏旁部首

正确答案:C

16.传统的文献检索工具体系由()工具书构成。

A.电子版

B.网络版

C.光盘版

D.印刷版

正确答案:D

17.被称为“参考性文献”的文献是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:C

18.布尔逻辑运算符中表示逻辑“非”的符号是()。

A.+

B.-

C.*

D./

正确答案:B

19.手册的基本特点是()。

A.侧重揭示文献内部特征

B.内容新颖,连续出版

C.著录内容标明出处

D.所收资料侧重基础知识,注重实用性

正确答案:D

20.检索工具的特点是()

A.完整性、分散性、查考性

B.综合性、参考性、易检性

C.完整性、易检性、查考性

D.易检性、综合性、分散性

正确答案:C

21.()的突出特点是,以“字”为中心,形、音、义兼顾,历史地、全面地、正确地反映其演变和发展。

A.《新华字典》

B.《古汉语常用字字典》

C.《中华大字典》

D.《汉语大字典》

正确答案:D

22.将《说文解字》开创的540部首改为214部首的著作是()。

A.《字汇》

B.《正字通》

C.《康熙字典》

D.《佩文诗韵》

正确答案:A

23.中国最早的词典是()

A.《仓颉篇》

B.《急就篇》

C.《说文解字》

D.《尔雅》

正确答案:D

24.()是一部以解释汉字形、音、义为主要内容的大型历史性详解字典。

A.《新华字典》

B.《古汉语常用字字典》

C.《中华大字典》

D.《汉语大字典》

正确答案:D

25.()的编纂方针是“古今皆收,源流并重”。

A.《中华大字典》

B.《汉语大词典》

C.《辞源》

D.《辞海》

正确答案:B

26.()表示一个单字有两个以上的音义,形成两个以上的字头。

A.字头单字右上角标

B.字头单字左上角标

C.语词单字右下角标

D.语词单字左下角标

正确答案:A

27.我国历史上第一部具有方言词典性质的汉语比较方言词汇集是()

A.《方言》

B.《急就篇》

C.《说文解字》

D.《尔雅》

正确答案:A

28.确立了字书释文先注音、后释义以及字义有序排列、释义列举书证的体例的字书是()。

A.《字汇》

B.《正字通》

C.《康熙字典》

D.《佩文诗韵》

正确答案:A

29.建国后我国编纂出版的最有代表性的字典是()。

A.《新华字典》

B.《古汉语常用字字典》

C.《中华大字典》

D.《汉语大字典》

正确答案:A

30.大规模查考汉语字词的代表性工具书是()。

A.《中华大字典》

B.《汉语大词典》

C.《辞源》

D.《辞海》

正确答案:B 论述题:(共2题 每题20分)

1.规范引证标注方法的原因

正确答案:

虽然它并不反映学术成果的内在学术含量,但却是外化内在学术含量的基本手段;虽然不能反映作者的全部水平,却可以反映作者的研究态度和学术积累;虽然不是学术研究和学术规范的全部内容,却是学术研究的必要条件和学术规范的起点;总而言之,它是接受过基本的学术训练的标志,是具有基本的学术素养的标志,是建立良好的学术道德的程序性制约。

请给分:

2.年鉴的概念及其特点

正确答案:

概念:年鉴是一种全面记述事业的发展,系统汇集重要时事文献信息,逐年编辑、连续出版的资料工具书。特点:(1)整体构成容纳了多种类型的工具书要素,内容体系多元互补,集知识、数据、资料于一身;(2)逐年编辑,连续出版;(3)以栏目作为容纳内容的基本单元,以条目作为表现内容的主要手段。

单选题:(共30道试题,每题2分)

1.网页时间是指()

A.网页最终修改的时间

B.网页生成的时间

C.网页浏览的时间

D.网页初次修改时间

正确答案:B

2.下列哪项工具书不是参考性工具书。()

A.手册

B.图录

C.词典

D.年鉴

正确答案:C

3.下列哪项工具书是资料性工具书()

A.字典

B.书目

C.年鉴

D.索引

正确答案:C

4.在CAJ-CD规范中,纸张型参考文献类型的标识方式是()。

A.单字母

B.双字母

C.多字母

D.数字

正确答案:A

5.电子版检索工具的检索入口是()。

A.数据库

B.拼音

C.检索词

D.偏旁部首

正确答案:C

6.被称为“研究文献的文献”的是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:C

7.被称为“线索性文献”的文献是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:B

8.被称为“第一手资料”的文献是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:A

9.被称为“检索性文献”的文献是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:B

10.被称为“原始文献”的文献是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:A

11.布尔逻辑运算符中表示逻辑“与”的符号是()。

A.+

B.-

C.*

D./

正确答案:C

12.在CAJ-CD规范中,符号“J”表示的参考文献类型是()

A.专著

B.论文集

C.报纸文章

D.期刊文章

正确答案:D

13.二次文献包括()

A.目录

B.述评

C.手册

D.综述

正确答案:A

14.在CAJ-CD规范中,符号“M”表示的参考文献类型是()

A.专著

B.论文集

C.报纸文章

D.期刊文章

正确答案:A

15.书目数据库主要提供的是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:B

16.检索工具的特点是()

A.完整性、分散性、查考性

B.综合性、参考性、易检性

C.完整性、易检性、查考性

D.易检性、综合性、分散性

正确答案:C

17.一次文献具有的特点是()

A.原创性

B.检索性

C.综合性

D.参考性

正确答案:A

18.二次文献具有的特点是()

A.原创性

B.检索性

C.综合性

D.参考性

正确答案:B

19.布尔逻辑运算符中表示逻辑“非”的符号是()。

A.+

B.-

C.*

D./

正确答案:B

20.揭示文献内容出处的线索型工具书被称为()。

A.书目

B.索引

C.百科全书

D.类书

正确答案:B

21.最新的《现代汉语词典》是第几版。()

A.4

B.5

C.6

D.7

正确答案:B

22.首创按照部首归并集中汉字的字书编纂方法的著作是()。

A.《方言》

B.《急就篇》

C.《说文解字》

D.《尔雅》

正确答案:C

23.《辞源》的本质特点是()。

A.实用

B.溯源

C.百科性

D.容量大

正确答案:B

24.()完善了唐代以来韵书加注释、引文注出处的体制,确立了韵书作为“按韵编排的同音字典”的性质。

A.《韵集》

B.《广韵》

C.《切韵》

D.《声类》

正确答案:B

25.()分12集,以12地支标名,每集分上、中、下3卷。

A.《汉语大字典》

B.《康熙字典》

C.《辞源》

D.《辞海》

正确答案:B

26.以讲解字义、训释名物为住,兼及形体、读音的书称为()。

A.字典

B.词典

C.韵书

D.训诂书

正确答案:D

27.()是一部兼有字典和百科性质的综合性辞书。

A.《中华大字典》

B.《康熙字典》

C.《现代汉语词典》

D.《辞海》

正确答案:D

28.在中国辞书编纂史上具有深远影响的部首法,首创于()。

A.《中华大字典》

B.《汉语大词典》

C.《辞源》

D.《说文解字》

正确答案:D

29.()的突出特点是,以“字”为中心,形、音、义兼顾,历史地、全面地、正确地反映其演变和发展。

A.《新华字典》

B.《古汉语常用字字典》

C.《中华大字典》

D.《汉语大字典》

正确答案:D

30.我国历史上最早的韵书是()

A.《韵集》

B.《广韵》

C.《切韵》

D.《声类》

正确答案:D 论述题:(共2题 每题20分)

1.百科全书的发展历程

正确答案:

一般认为主要经历了三个阶段:(1)古代百科全书(5世纪前):编者是个人,内容是汇编通过讲学阐述的全面知识,具有教科书色彩。(2)中世纪百科全书(5世纪-18世纪初期):编者是修道院神职人员,内容是知识分类成果被广泛用于百科全书,具有宗教色彩。(3)现代百科全书(18世纪以后):编者一般是多学科合作,尤其是跨国合作,内容是以现代科学观念系统概述知识为主,兼及教育作用。

请给分:

2.电子词典深度开发的表现

正确答案:

(1)检索系统的开发。(2)内容的整合。(3)相关内容的跳转。(4)基本信息的添加。(5)字音朗读

单选题:(共30道试题,每题2分)

1.被称为“参考性文献”的文献是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:C

2.使用简体汉字编码的地区有()

A.新加坡

B.香港

C.澳门

D.台湾

正确答案:A

3.被称为“原始文献”的文献是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:A

4.二次检索的检索主题与一次检索的检索主题的关系不包含()关系。

A.包含关系

B.下位关系

C.并列关系

D.完全不相关

正确答案:D

5.下列哪项不是印刷版工具书的排检方法()。

A.部首法

B.检索词

C.拼音法

D.笔画笔形法

正确答案:B

6.信息检索中的检索词可分为四类,下列哪一项不属于检索词的分类(A.表示主题的检索词

B.表示作者的检索词

C.表示分类的检索词

D.表示数据的检索词

正确答案:D

7.索引数据库主要提供的是()

A.一次文献

B.二次文献

C.三次文献

D.零次文献

正确答案:B

8.下列哪项工具书不是参考性工具书。()

A.手册

B.图录

C.词典

D.年鉴

正确答案:C

9.电子版检索工具的检索入口是()。

A.数据库

B.拼音

C.检索词

D.偏旁部首

正确答案:C

10.布尔逻辑运算符中表示逻辑“非”的符号是()。

A.+

B.-

C.*

D./

正确答案:B

11.网页时间是指()。)

A.网页最终修改的时间

B.网页生成的时间

C.网页浏览的时间

D.网页初次修改时间

正确答案:B

12.利用布尔逻辑检索技术来检索包含司马迁或包含《史记》的文章,输入的检索条件是()。

A.司马迁+《史记》

B.司马迁—《史记》

C.司马迁*《史记》

D.司马迁not《史记》

正确答案:A

13.高级检索的检索特点是()。

A.组配检索、清晰检索、限定检索

B.清晰检索、限定检索、模糊检索

C.组配检索、清晰检索、模糊检索

D.组配检索、模糊检索、限定检索

正确答案:D

14.揭示文献内容出处的线索型工具书被称为()。

A.书目

B.索引

C.百科全书

D.类书

正确答案:B

15.下列哪项工具书是语言性工具书。()

A.手册

B.图录

C.字典

D.表谱

正确答案:C

16.部首法作为印刷版工具书的主要排检方法,首创于()。

A.《中华大字典》

B.《说文解字》

C.《康熙字典》

D.《字汇》

正确答案:B

17.“民用!建设”中的两个叹号代表嵌入的字数是()。

A.2个

B.4个

C.0—1个

D.0—2个

正确答案:D

18.利用布尔逻辑检索技术来检索包含司马迁和《史记》的文章,输入的检索条件是()。

A.司马迁+《史记》

B.司马迁—《史记》

C.司马迁*《史记》

D.司马迁or《史记》

正确答案:C

19.搜索引擎中常用的结果输出限定方法不包括()。

A.信息线索级别限定

B.类聚方法限定

C.时间限定

D.字体编码限定

正确答案:C

20.在CAJ-CD规范中,纸张型参考文献类型的标识方式是()。

A.单字母

B.双字母

C.多字母

D.数字

正确答案:A

21.清代康熙年间编辑成书的(),是当时权威的官修标准韵书。

A.《韵集》

B.《广韵》

C.《切韵》

D.《佩文诗韵》

正确答案:D

22.确立了字书释文先注音、后释义以及字义有序排列、释义列举书证的体例的字书是()。

A.《字汇》

B.《正字通》

C.《康熙字典》

D.《佩文诗韵》

正确答案:A

23.建国后我国编纂出版的最有代表性的字典是()。

A.《新华字典》

B.《古汉语常用字字典》

C.《中华大字典》

D.《汉语大字典》

正确答案:A

24.中国历史上第一部明确以“字典”命名的字书是()。

A.《字汇》

B.《正字通》

C.《康熙字典》

D.《佩文诗韵》

正确答案:C

25.我国历史上最早的韵书是()

A.《韵集》

B.《广韵》

C.《切韵》

D.《声类》

正确答案:D

26.我国现存最早的用于教授学童识字的字书是()。

A.《仓颉篇》

B.《急就篇》

C.《说文解字》

D.《尔雅》

正确答案:B

27.隋朝陆法言编著的(),成为后世传统韵书演变的基础。

A.《韵集》

B.《广韵》

C.《切韵》

D.《声类》

正确答案:C

28.将《说文解字》开创的540部首改为214部首的著作是()。

A.《字汇》

B.《正字通》

C.《康熙字典》

D.《佩文诗韵》

正确答案:A

29.中国古代形态的辞书向近代形态的字典、词典转化的标志是()。

A.《汉语大字典》和《汉语大词典》的出现

B.《中华大字典》和《辞源》的出现

C.《辞海》和《辞源》的出现

D.《新华字典》和《新华词典》的出现

正确答案:B

30.首创按照部首归并集中汉字的字书编纂方法的著作是()。

A.《方言》

B.《急就篇》

C.《说文解字》

D.《尔雅》

正确答案:C

论述题:(共2题 每题20分)

1.试述近代以来图书内容发生了哪些变化?

正确答案:

西学强烈冲击中国传统典籍经史子集的内容格局,其中最具时代特点、对近代以来学术文化乃至社会发展产生深远影响的是以下三类图书:译书的变化:近代以前,中国的译书主要是宗教内容,明末清初出现少量科学著作翻译。近代以来的译书分为两个阶段:中日甲午战争前主要集中在与制船造炮等近代工业有关的声光电化等自然科学,甲午战争之后,翻译重点转向社会科学,特别是西方的政治制度、社会学说、经济法律等方面。近代工具书的变化:伴随着西学东渐,近代工具书出现了两个方面的变化:一是中国固有的工具书类型开始借鉴西方的编制方法而走向现代化,如字典、词典;二是一些产生于西方的工具书类型被引进中国,如百科全书、年鉴、索引等。变化的结果是中国的工具书编纂在整体上由古代阶段演进到现代阶段,较为完整的工具书体系逐渐形成。近代教科书的变化:在中国古代,虽有识字启蒙的字书但并没有形成独立的图书类型。1902年清政府颁布学堂章程,通令全国遍设学堂后,以传播自然科学和社会科学为主要内容的新式教科书及学堂辅助读物才开始大量出现。

请给分:

2.网站资源检索策略

正确答案:

(1)要从整体上了解不同类型的网站容纳的信息资源的不同特点(2)需要了解网站中文献信息资源的组织结构和方法(3)充分利用网站提供的检索功能

单选题:(共30道试题,每题2分)

1.综合性丛书也被称为(),意谓其选的典籍是跨类别的。

A.类编丛书

B.汇编丛书

C.地方丛书

D.普通丛书

正确答案:B

2.类书最突出的特点是()。

A.事居于前,文列于后

B.天人合一

C.抄录资料

D.区分胪列,靡所不载

正确答案:D

3.在编纂体例上,()带有典型的中国传统的分类目录形式。

A.《汉书•艺文志》

B.《隋书•经籍志》

C.《七略》

D.《四库全书总目》

正确答案:D

4.中国古代最早的类书出现在()。

A.汉代

B.唐代

C.三国

D.晋代

正确答案:C

5.《隋书•经籍志》分类典籍的方法称为()。

A.四部法

B.五部法

C.六部法

D.七部法

正确答案:A

6.清代陈梦雷等编纂的()是现存的规模最大的类书。

A.《古今图书集成》

B.《皇览》

C.《韵海镜源》

D.《永乐大典》

正确答案:A

7.下面哪一部著作不是“十三经”里的著作。()

A.《周易》

B.《尚书》

C.《汉书》

D.《诗经》

正确答案:C

8.从古至今,类分中国古籍的最主要的方法是()。

A.四分法

B.五分法

C.六分法

D.七分法

正确答案:A

9.“四部法”中将历史著作归入()。

A.经部

B.史部

C.子部

D.集部

正确答案:B

10.南朝梁学者阮孝绪编纂的总结性书目是()。

A.《七略》

B.《七录》

C.《中经新簿》

D.《晋元帝书目》

正确答案:B

11.百科全书的基本单元是(),它是百科全书输入和输出知识信息的基本单位。

A.词条

B.释文

C.条目

D.参考书目

正确答案:C

12.使用电子图书系统的基本步骤是()。

A.下载并安装专用阅读器、在线阅读、登陆注册

B.在线阅读、登陆注册、下载并安装专用阅读器

C.下载并安装专用阅读器、登陆注册、在线阅读

D.在线阅读、下载并安装专用阅读器、登陆注册

正确答案:C

13.公元5世纪前的百科全书被称为()。

A.古代百科全书

B.中世纪百科全书

C.现代百科全书

D.当代百科全书

正确答案:A

14.18世纪中期以后的百科全书的编者主要是()。

A.个人

B.修道院神职人员

C.多学科合作

D.单一学科

正确答案:C

15.百科全书中,()是条目的标题,既是知识主题的概括,又是基本的检索标志。

A.条头

B.词条

C.释文

D.参考书目

正确答案:A

16.下列哪部百科全书是综合性百科全书。()

A.《不列颠百科全书》

B.《北京百科全书》

C.《不列颠少年百科全书》

D.《儿童百科全书》

正确答案:A

17.1920年4月出版的《共产党宣言》是由谁翻译的?()

A.严复

B.陈望道

C.林纾

D.梁启超

正确答案:B

18.1915年出版的(),在编排方法上,采用了“以字带词、分条释义”的体制,标志着中国历史悠久的字书迈进了现代字典、词典的阶段。

A.《新华字典》

B.《辞海》

C.《辞源》

D.《现代汉语词典》

正确答案:C

19.在国家图书馆“联机公共目录查询系统”中,以“文化研究”作为题名检索词并且词邻近选择“否”的检索结果,不会出现的检索结果是()。

A.中日文化交流研究

B.鲁迅文学研究

C.中印文学比较研究

D.中国文化研究

正确答案:D

20.下列哪种百科全书不是少年儿童百科全书。()

A.《儿童小百科全书》

B.《不列颠百科全书》

C.《不列颠少年百科全书》

D.《儿童百科全书》

正确答案:B

21.1895年甲午战争以前的译书主要集中在()方面。

A.社会科学

B.自然科学

C.宗教学

D.军事学

正确答案:B

22.()是概述一切门类知识或某一门类知识的工具书,是历史上科学文化成就的总结性著述。

A.百科全书

B.类书

C.年鉴

D.书目

正确答案:A

23.下列哪部百科全书是国家与地区性百科全书。()

A.《不列颠百科全书》

B.《北京百科全书》

C.《不列颠少年百科全书》

D.《儿童百科全书》

正确答案:B

24.在国家图书馆“联机公共目录查询系统”中,以“文化研究”作为题名检索词并且词邻近选择“是”的检索结果,会出现的检索结果是()。

A.中日文化交流研究

B.鲁迅文学研究

C.中印文学比较研究

D.中国文化研究

正确答案:D

25.利用计算机阅读平台或手持阅读设备阅读的数字化图书是()。

A.数字图书

B.印刷图书

C.电子图书

D.线装图书

正确答案:C

26.百科全书的条目不包含以下哪一项。()

A.条头

B.词条

C.释文

D.参考书目

正确答案:B

27.在中国期刊全文数据库中,与命中文献有相关关系论文的链接检索称为()。

A.基本检索

B.类聚检索

C.二次检索

D.高级检索

正确答案:B

28.在中国期刊全文数据库中,以字段词作为检索词进行检索称为()。

A.基本检索

B.类聚检索

C.二次检索

D.高级检索

正确答案:A

29.电子版年鉴与印刷版年鉴的区别在于()。

A.强化检索功能

B.弱化检索功能

C.减少检索功能

D.减少应用工具

正确答案:A

30.()是一种全面记述事业的发展,系统汇集重要时事文献信息,逐年编辑、连续出版的资料工具书。

A.类书

B.百科全书

C.年鉴

D.表谱

正确答案:C 论述题:(共2题 每题20分)

1.试述近代以来图书内容发生了哪些变化?

正确答案:

西学强烈冲击中国传统典籍经史子集的内容格局,其中最具时代特点、对近代以来学术文化乃至社会发展产生深远影响的是以下三类图书:译书的变化:近代以前,中国的译书主要是宗教内容,明末清初出现少量科学著作翻译。近代以来的译书分为两个阶段:中日甲午战争前主要集中在与制船造炮等近代工业有关的声光电化等自然科学,甲午战争之后,翻译重点转向社会科学,特别是西方的政治制度、社会学说、经济法律等方面。近代工具书的变化:伴随着西学东渐,近代工具书出现了两个方面的变化:一是中国固有的工具书类型开始借鉴西方的编制方法而走向现代化,如字典、词典;二是一些产生于西方的工具书类型被引进中国,如百科全书、年鉴、索引等。变化的结果是中国的工具书编纂在整体上由古代阶段演进到现代阶段,较为完整的工具书体系逐渐形成。近代教科书的变化:在中国古代,虽有识字启蒙的字书但并没有形成独立的图书类型。1902年清政府颁布学堂章程,通令全国遍设学堂后,以传播自然科学和社会科学为主要内容的新式教科书及学堂辅助读物才开始大量出现。

请给分:

2.百科全书的发展历程

正确答案:

一般认为主要经历了三个阶段:(1)古代百科全书(5世纪前):编者是个人,内容是汇编通过讲学阐述的全面知识,具有教科书色彩。(2)中世纪百科全书(5世纪-18世纪初期):编者是修道院神职人员,内容是知识分类成果被广泛用于百科全书,具有宗教色彩。(3)现代百科全书(18世纪以后):编者一般是多学科合作,尤其是跨国合作,内容是以现代科学观念系统概述知识为主,兼及教育作用。

单选题:(共30道试题,每题2分)

1.()是查考中国典籍流通传播的第二道重要关卡。

A.《汉书•艺文志》

B.《隋书•经籍志》

C.《七略》

D.《四库全书总目》

正确答案:B

2.类书最突出的特点是()。

A.事居于前,文列于后

B.天人合一

C.抄录资料

D.区分胪列,靡所不载

正确答案:D

3.()的最大特点,是精选宋元旧刻,明清精刻、抄本、校本和手稿本。

A.《永乐大典》

B.《百科全书》

C.《四库全书》

D.《四部丛刊》

正确答案:D

4.《七略》分类典籍的方法称为()。

A.四分法

B.五分法

C.六分法

D.七分法

正确答案:C

5.我国现存最早的完整类书是()。

A.《艺文类聚》

B.《皇览》

C.《韵海镜源》

D.《永乐大典》

正确答案:A

6.在“汉籍电子文献瀚典全文检索系统”中,检索的结果是目录列表的形式称为()。

A.检索报表

B.检索条列

C.检索类目

D.检索全文

正确答案:B

7.中国古代最早的类书出现在()。

A.汉代

B.唐代

C.三国

D.晋代

正确答案:C

8.()丛书也被称为“汇编丛书”,意谓其选的典籍是跨类别的。

A.综合性

B.专门性

C.地方性

D.普遍性

正确答案:A

9.下面哪一部著作不是“十三经”里的著作。()

A.《论语》

B.《庄子》

C.《孟子》

D.《诗经》

正确答案:B

10.()是查考中国典籍流通传播的最后也是最重要的一道关卡。

A.《汉书•艺文志》

B.《隋书•经籍志》

C.《七略》

D.《四库全书总目》

正确答案:D

11.以传播近代自然科学、社会科学为主要内容的新式教科书及学堂辅助读物大量出现是在什么时期?()

A.18世纪末

B.19世纪初

C. 19世纪末

D.20世纪初

正确答案:D

12.()是概述一切门类知识或某一门类知识的工具书,是历史上科学文化成就的总结性著述。

A.百科全书

B.类书

C.年鉴

D.书目

正确答案:A

13.在国家图书馆“联机公共目录查询系统”中,以“文化研究”作为题名检索词并且词邻近选择“是”的检索结果,会出现的检索结果是()。

A.中日文化交流研究

B.鲁迅文学研究

C.中印文学比较研究

D.中国文化研究

正确答案:D

14.下列哪部百科全书是综合性百科全书。()

A.《儿童百科全书》

B.《北京百科全书》

C.《不列颠少年百科全书》

D.《布洛克豪斯百科全书》

正确答案:D

15.百科全书的条目不包含以下哪一项。()

A.条头

B.词条

C.释文

D.参考书目

正确答案:B

16.使用电子图书系统的基本步骤是()。

A.下载并安装专用阅读器、在线阅读、登陆注册

B.在线阅读、登陆注册、下载并安装专用阅读器

C.下载并安装专用阅读器、登陆注册、在线阅读

D.在线阅读、下载并安装专用阅读器、登陆注册

正确答案:C

17.1915年出版的(),在编排方法上,采用了“以字带词、分条释义”的体制,标志着中国历史悠久的字书迈进了现代字典、词典的阶段。

A.《新华字典》

B.《辞海》

C.《辞源》

D.《现代汉语词典》

正确答案:C

18.概述某一门类知识的百科全书称为()。

A.综合性百科全书

B.国家与地区性百科全书

C.专业性百科全书

D.少年儿童百科全书

正确答案:C

19.百科全书的基本单元是(),它是百科全书输入和输出知识信息的基本单位。

A.词条

B.释文

C.条目

D.参考书目

正确答案:C

20.以“物竞天择,适者生存”为观点的《天演论》是由谁翻译的?()

A.严复

B.陈望道

C.林纾

D.梁启超

正确答案:A

21.具有地域范围界限的百科全书称为()。

A.综合性百科全书

B.国家与地区性百科全书

C.专业性百科全书

D.少年儿童百科全书

正确答案:B

22.从内容来看,近代以来的译书经历的两个发展阶段是以()为分界点的。

A.五四运动

B.第一次鸦片战争

C.第二次鸦片战争

D.中日甲午战争

正确答案:D

23.下列哪种百科全书不是少年儿童百科全书。()

A.《儿童小百科全书》

B.《不列颠百科全书》

C.《不列颠少年百科全书》

D.《儿童百科全书》

正确答案:B

24.1895年甲午战争以前的译书主要集中在()方面。

A.社会科学

B.自然科学

C.宗教学

D.军事学

正确答案:B

25.()是第一位用古文翻译西方文学作品的人。

A.严复

B.陈望道

C.林纾

D.梁启超

正确答案:C

26.在现代工具书体系中,有“工具书之王”美誉的是()。

A.百科全书

B.类书

C.年鉴

D.书目

正确答案:A

27.中文期刊全文数据库网络版的基本使用方法是()。

A.论文资料下载、论文资料检索、使用专用阅读器阅览

B.论文资料检索、使用专用阅读器阅览、论文资料下载

C.论文资料下载、使用专用阅读器阅览、论文资料检索

D.论文资料检索、论文资料下载、使用专用阅读器阅览

正确答案:D

28.在中国期刊全文数据库中,以字段词作为检索词进行检索称为()。

A.基本检索

B.类聚检索

C.二次检索

D.高级检索

正确答案:A

29.()是一种全面记述事业的发展,系统汇集重要时事文献信息,逐年编辑、连续出版的资料工具书。

A.类书

B.百科全书

C.年鉴

D.表谱

正确答案:C

30.由学术性学会、协会主办,反映某一学科领域的学术活动、研究动态、研究成果、研究资料等的年鉴称为()。

A.政府年鉴

B.行业年鉴

C.学科年鉴

D.百科全书年鉴

正确答案:C 论述题:(共2题 每题20分)

1.界定“善本”的原则

正确答案:

(1)宋明时期,一般把精加校勘的书本称为善本。(2)晚清,张之洞的界定:“善本之义有三:一,足本,无缺卷,未删削;二,精本,一精校,一精注;三,旧本,一旧刻,一旧抄。” 丁丙的界定:旧刻、精本、旧抄、旧校。(3)当今学术界规定“三性九条”原则 :历史文物性、学术资料性、艺术代表性;“九条”是对三性原则的解释性规定。

请给分:

2.试述古籍资源的分类方法。

正确答案:

我国最早对古籍资源整体而系统的分类,出现在汉代,标志是我国最早的系统目录《七略》的完成。《七略》原书已亡轶,但其分类体系被完整地保留在《汉书?艺文志》中,史称“六分法”,包括:六艺略、诸子略、诗赋略、兵书略、数术略、方技略。中古时期,南朝梁国的阮孝绪编纂了总结性书目《七录》,但一般认为它把典籍分为五大类,史称“五分法”。其分类为:经典录、纪传录、子兵录、文集录、术伎录、佛法录、仙道录。唐代初年,又一部划时代的总结性的书目问世,它就是《隋书?经籍志》,直到今天,它依然是我国古籍资源最主要的分类方法。分为:经——儒家经典以及阐释儒家经典的著作。史——历史著作。子——传统学术中的“杂学”。主要包括诸子、兵书、数术、方技、佛教、道教等类别的典籍。集——文学及文学评论作品。

单选题:(共30道试题,每题2分)

1.中国古代最早的类书出现在()。

A.汉代

B.唐代

C.三国

D.晋代

正确答案:C

2.被称为我国古代第二次大规模的学术文化总结时期的是()。

A.晋代

B.隋代

C.唐代

D.宋代

正确答案:C

3.中国古代类书采用的分类体系是将自然界和人类社会的万事万物分为()的模式。

A.天、地、人

B. 天、地、人、事、物

C.天、人、事、物

D.天、地、人、畜、物

正确答案:B

4.从古至今,类分中国古籍的最主要的方法是()。

A.四分法

B.五分法

C.六分法

D.七分法

正确答案:A

5.()丛书也被称为“类编丛书”,意谓其选收的典籍是属于同一类别的。

A.综合性

B.专门性

C.地方性

D.普遍性

正确答案:B

6.下面哪一部著作不是“十三经”里的著作。()

A.《论语》

B.《庄子》

C.《孟子》

D.《诗经》

正确答案:B

7.()的最大特点,是精选宋元旧刻,明清精刻、抄本、校本和手稿本。

A.《永乐大典》

B.《百科全书》

C.《四库全书》

D.《四部丛刊》

正确答案:D

8.在“汉籍电子文献瀚典全文检索系统”中,要检索包含“君臣”但不包含 “父子”的诗文,输入的检索条件应该为()。

A.君臣|父子

B.君臣!父子

C.君臣?父子

D.君臣&父子

正确答案:B

9.《七略》分类典籍的方法称为()。

A.四分法

B.五分法

C.六分法

D.七分法

正确答案:C

10.中国古代最早的类书是(),但现已亡佚。

A.《古今图书集成》

B.《皇览》

C.《韵海镜源》

D.《永乐大典》

正确答案:B

11.1915年出版的(),在编排方法上,采用了“以字带词、分条释义”的体制,标志着中国历史悠久的字书迈进了现代字典、词典的阶段。

A.《新华字典》

B.《辞海》

C.《辞源》

D.《现代汉语词典》

正确答案:C

12.下列哪部百科全书是国家与地区性百科全书。()

A.《不列颠百科全书》

B.《北京百科全书》

C.《不列颠少年百科全书》

D.《儿童百科全书》

正确答案:B

13.我国第一部大型综合性百科全书是()。

A.《日用百科全书》

B.《少年百科全书》

C.《中国大百科全书》

D.《简明中华百科全书》

正确答案:C

14.西方四大经典百科全书是()。

A.《不列颠百科全书》、《社交词典》、《百科全书》、《拉鲁斯百科全书》

B.《不列颠百科全书》、《百科全书》、《拉鲁斯百科全书》、《美国百科全书》

C.《社交词典》、《百科全书》、《拉鲁斯百科全书》、《美国百科全书》

D.《不列颠百科全书》、《社交词典》、《拉鲁斯百科全书》、《美国百科全书》

正确答案:D

15.在内容上覆盖历史上已经出现的各门类知识的百科全书是()。

A.综合性百科全书

B.国家与地区性百科全书

C.专业性百科全书

D.少年儿童百科全书

正确答案:A

16.在现代工具书体系中,有“工具书之王”美誉的是()。

A.百科全书

B.类书

C.年鉴

D.书目

正确答案:A

17.百科全书中,()是条目的标题,既是知识主题的概括,又是基本的检索标志。

A.条头

B.词条

C.释文

D.参考书目

正确答案:A

18.18世纪中期以后的百科全书被称为()。

A.古代百科全书

B.中世纪百科全书

C.现代百科全书

D.当代百科全书

正确答案:C

19.公元5世纪前的百科全书被称为()。

A.古代百科全书

B.中世纪百科全书

C.现代百科全书

D.当代百科全书

正确答案:A

20.公元5世纪以后至18世纪初的百科全书的编者主要是()。

A.个人

B.修道院神职人员

C.多学科合作

D.单一学科

正确答案:B

21.百科全书的基本单元是(),它是百科全书输入和输出知识信息的基本单位。

A.词条

B.释文

C.条目

D.参考书目

正确答案:C

22.1915年出版的(),在编排方法上,采用了“以字带词、分条释义”的体制,标志着中国历史悠久的字书迈进了现代字典、词典的阶段。

A.《新华字典》

B.《辞海》

C.《中华大字典》

D.《现代汉语词典》

正确答案:C

23.百科全书中,()是向读者推荐的深入钻研该条目内容的重要参考著作。

A.条头

B.词条

C.释文

D.参考书目

正确答案:D

24.以传播近代自然科学、社会科学为主要内容的新式教科书及学堂辅助读物大量出现是在什么时期?()

A.18世纪末

B.19世纪初

C. 19世纪末

D.20世纪初

正确答案:D

25.在国家图书馆“联机公共目录查询系统”中,以“文化研究”作为题名检索词并且词邻近选择“是”的检索结果,会出现的检索结果是()。

A.中日文化交流研究

B.鲁迅文学研究

C.中印文学比较研究

D.中国文化研究

正确答案:D

26.在内容上突出强调“寓知识于故事和图画之中”的百科全书是()。

A.综合性百科全书

B.国家与地区性百科全书

C.专业性百科全书

D.少年儿童百科全书

正确答案:D

27.在中国期刊全文数据库中,以字段词作为检索词进行检索称为()。

A.基本检索

B.类聚检索

C.二次检索

D.高级检索

正确答案:A

28.在中国期刊全文数据库中,与命中文献有相关关系论文的链接检索称为()。

A.基本检索

B.类聚检索

C.二次检索

D.高级检索

正确答案:B

29.由学术性学会、协会主办,反映某一学科领域的学术活动、研究动态、研究成果、研究资料等的年鉴称为()。

A.政府年鉴

B.行业年鉴

C.学科年鉴

D.百科全书年鉴

正确答案:C

30.电子版年鉴与印刷版年鉴的区别在于()。

A.添加应用工具

B.弱化检索功能

C.减少检索功能

D.减少应用工具

正确答案:A 论述题:(共2题 每题20分)

1.中国辞书体系形成的标志

正确答案:

(1)基础性、权威性汉语语文辞书已经形成系列;(2)汉外对照的双语辞书基本覆盖了所有实用语种;(3)学科性辞书基本覆盖了所有主要学科;(4)辞书的品种、类型多样化;(5)辞书的功能、效用特定化;(6)辞书的社会认知程度明显提高。

请给分:

2.什么是位置检索,有什么优点?

正确答案:

位置检索主要运用于全文数据库,它是一种对多个检索词在源文献中相对位置进行限定的方法,在现有中文版电子检索系统中,一般都将位置检索固化在检索界面,而且主要位置限定是“同段同现”和“同句同现”。位置检索的优点是:为查找相关概念在局部环境中的同现情况提供方便,而相关概念的同现往往意味着文献信息内容的相关,所以位置检索也是提高查全率和查准率的有效方法之一。单选题:(共30道试题,每题2分)

1.清代陈梦雷等编纂的()是现存的规模最大的类书。

A.《古今图书集成》

B.《皇览》

C.《韵海镜源》

D.《永乐大典》

正确答案:A

2.中国古代最早的类书是三国时期的()。

A.《古今图书集成》

B.《皇览》

C.《韵海镜源》

D.《永乐大典》

正确答案:B

3.中国古代最早的类书出现在()。

A.汉代

B.唐代

C.三国

D.晋代

正确答案:C

4.在“汉籍电子文献瀚典全文检索系统”中,要检索包含“君臣”但不包含 “父子”的诗文,输入的检索条件应该为()。

A.君臣|父子

B.君臣!父子

C.君臣?父子

D.君臣&父子

正确答案:B

5.以下哪项是南开大学组合数学研究中心和天津永川软件技术有限公司开发的“二十五史全文阅读检索系统”的功能。()

A.全文阅读

B.基本检索

C.辅助工具和研究支持功能

D.初级检索

正确答案:A

6.“四部法”中将文学及文学批评作品归入()。

A.经部

B.史部

C.子部

D.集部

正确答案:D

7.中国古代最早的类书是(),但现已亡佚。

A.《古今图书集成》

B.《皇览》

C.《韵海镜源》

D.《永乐大典》

正确答案:B

8.()是查考中国典籍流通传播的第一道重要关卡。

A.《汉书•艺文志》

B.《隋书•经籍志》

C.《七略》

D.《四库全书总目》

正确答案:A

9.《隋书•经籍志》分类典籍的方法称为()。

A.四部法

B.五部法

C.六部法

D.七部法

正确答案:A

10.()丛书也被称为“汇编丛书”,意谓其选的典籍是跨类别的。

A.综合性

B.专门性

C.地方性

D.普遍性

正确答案:A

11.百科全书的基本单元是(),它是百科全书输入和输出知识信息的基本单位。

A.词条

B.释文

C.条目

D.参考书目

正确答案:C

12.我国第一部大型综合性百科全书是()。

A.《日用百科全书》

B.《少年百科全书》

C.《中国大百科全书》

D.《简明中华百科全书》

正确答案:C

13.在现代工具书体系中,有“工具书之王”美誉的是()。

A.百科全书

B.类书

C.年鉴

D.书目

正确答案:A

14.1895年甲午战争以前的译书主要集中在()方面。

A.社会科学

B.自然科学

C.宗教学

D.军事学

正确答案:B

15.概述某一门类知识的百科全书称为()。

A.综合性百科全书

B.国家与地区性百科全书

C.专业性百科全书

D.少年儿童百科全书

正确答案:C

16.公元5世纪前的百科全书被称为()。

A.古代百科全书

B.中世纪百科全书

C.现代百科全书

D.当代百科全书

正确答案:A

17.百科全书中,()是条目的标题,既是知识主题的概括,又是基本的检索标志。

A.条头

B.词条

C.释文

D.参考书目

正确答案:A

18.下列哪部百科全书是综合性百科全书。()

A.《儿童百科全书》

B.《北京百科全书》

C.《不列颠少年百科全书》

D.《布洛克豪斯百科全书》

正确答案:D

19.中国历史上最大规模的“西书中译”活动是在()时期开始的。

A.五四运动前后

B.鸦片战争前后

C.辛亥革命前后

D.甲午战争前后

正确答案:B

20.从内容来看,近代以来的译书经历的两个发展阶段是以()为分界点的。

A.五四运动

B.第一次鸦片战争

C.第二次鸦片战争

D.中日甲午战争

正确答案:D

21.下列哪种百科全书不是少年儿童百科全书。()

A.《儿童小百科全书》

B.《不列颠百科全书》

C.《不列颠少年百科全书》

D.《牛津少年百科全书》

正确答案:B

22.西方四大经典百科全书是()。

A.《不列颠百科全书》、《社交词典》、《百科全书》、《拉鲁斯百科全书》

B.《不列颠百科全书》、《百科全书》、《拉鲁斯百科全书》、《美国百科全书》

C.《社交词典》、《百科全书》、《拉鲁斯百科全书》、《美国百科全书》

D.《不列颠百科全书》、《社交词典》、《拉鲁斯百科全书》、《美国百科全书》

正确答案:D

23.下列哪部百科全书是国家与地区性百科全书。()

A.《不列颠百科全书》

B.《北京百科全书》

C.《不列颠少年百科全书》

D.《儿童百科全书》

正确答案:B

24.1915年出版的(),在编排方法上,采用了“以字带词、分条释义”的体制,标志着中国历史悠久的字书迈进了现代字典、词典的阶段。

A.《新华字典》

B.《辞海》

C.《中华大字典》

D.《现代汉语词典》

正确答案:C

25.鸦片战争前后,中国的翻译主体主要有()三股力量。

A.教会出版机构、官方出版机构、民间商办出版机构

B.教会出版机构、官方出版机构、外国商办出版机构

C.教会出版机构、民间商办出版机构、外国商办出版机构

D.官方出版机构、民间商办出版机构、外国商办出版机构

正确答案:A

26.()是第一位用古文翻译西方文学作品的人。

A.严复

B.陈望道

C.林纾

D.梁启超

正确答案:C

27.在中国期刊全文数据库中,以字段词作为检索词进行检索称为()。

A.基本检索

B.类聚检索

C.二次检索

D.高级检索

正确答案:A

28.中文期刊全文数据库网络版的基本使用方法是()。

A.论文资料下载、论文资料检索、使用专用阅读器阅览

B.论文资料检索、使用专用阅读器阅览、论文资料下载

C.论文资料下载、使用专用阅读器阅览、论文资料检索

D.论文资料检索、论文资料下载、使用专用阅读器阅览

正确答案:D

29.目前,中国年鉴资源全文数据库的主要功能不包括()

A.分类检索

B.字段词检索

C.全文检索

D.高级检索

正确答案:D

30.电子版年鉴与印刷版年鉴的区别在于()。

A.添加应用工具

B.弱化检索功能

C.减少检索功能

D.减少应用工具

正确答案:A

论述题:(共2题 每题20分)

1.相关度的概念及其影响因素

正确答案:

“相关度”是指检索结果与输入的检索词在内容上关联的疏密程度,由计算机根据词语主题关联分析技术自动处理完成。影响相关度的因素主要有:在数据库中匹配到的关键词数量的多少;关键词在网页中出现的位置;关键词在网页中出现的频率;关键词本身的词义和系统定义的权值大小等。

请给分:

2.文献信息检索工具的共同特点。

正确答案:

从内容上看,检索工具强调比较全面系统地汇集、记录某一方面的知识或资料,即具有完整性;从编排上看,检索工具强调必须按照特定的方法对内容加以组织、编排,即具有易检性;从编纂目的看,检索工具强调是供人们有目的地检索查考,而不是系统阅读,即具有查考性。单选题:(共30道试题,每题2分)

1.迄今为止收录古籍丛书数量最多的丛书目录是()。

A.《中国丛书综录》

B.《四库全书》

C.《儒学警悟》

D.《四部丛刊》

正确答案:A

2.在“汉籍电子文献瀚典全文检索系统”中,由题名到内容的目录递进层次称为()。

A.目录宽度

B.目录层级

C.目录长度

D.目录深度

正确答案:D

3.()开创了有中国特色的传统目录的先河。

A.《汉书•艺文志》

B.《隋书•经籍志》

C.《七略》

D.《四库全书总目》

正确答案:C

4.清代陈梦雷等编纂的()是现存的规模最大的类书。

A.《古今图书集成》

B.《皇览》

C.《韵海镜源》

D.《永乐大典》

正确答案:A

5.中国古代最早的类书出现在()。

A.汉代

B.唐代

C.三国

D.晋代

正确答案:C

6.《隋书•经籍志》分类典籍的方法称为()。

A.四部法

B.五部法

C.六部法

D.七部法

正确答案:A

7.类书在分类上一般按()的原则排比。

A.事居于前,文列于后

B.天人合一

C.抄录资料

D.区分胪列,靡所不载

正确答案:A

8.在“汉籍电子文献瀚典全文检索系统”中,检索的结果是全文列表的形式称为()。

A.检索报表

B.检索条列

C.检索类目

D.检索全文

正确答案:A

9.《七略》的成书时期是在()。

A.秦代

B.汉代

C.周代

D.魏晋时期

正确答案:B

10.在一个总书记名下汇集多种书形成的一套书称为()。

A.古籍版本

B.古籍丛刊

C.丛书

D.古籍流传

正确答案:C

11.下列哪种百科全书不是少年儿童百科全书。()

A.《儿童小百科全书》

B.《不列颠百科全书》

C.《不列颠少年百科全书》

D.《牛津少年百科全书》

正确答案:B

12.1915年出版的(),在编排方法上,采用了“以字带词、分条释义”的体制,标志着中国历史悠久的字书迈进了现代字典、词典的阶段。

A.《新华字典》

B.《辞海》

C.《辞源》

D.《现代汉语词典》

正确答案:C

13.我国第一部大型综合性百科全书是()。

A.《日用百科全书》

B.《少年百科全书》

C.《中国大百科全书》

D.《简明中华百科全书》

正确答案:C

14.公元5世纪以后至18世纪初的百科全书的编者主要是()。

A.个人

B.修道院神职人员

C.多学科合作

D.单一学科

正确答案:B

15.1920年4月出版的《共产党宣言》是由谁翻译的?()

A.严复

B.陈望道

C.林纾

D.梁启超

正确答案:B

16.()是概述一切门类知识或某一门类知识的工具书,是历史上科学文化成就的总结性著述。

A.百科全书

B.类书

C.年鉴

D.书目

正确答案:A

17.1895年甲午战争以后的译书主要集中在()方面。

A.社会科学

B.自然科学

C.宗教学

D.军事学

正确答案:A

18.公元5世纪前的百科全书被称为()。

A.古代百科全书

B.中世纪百科全书

C.现代百科全书

D.当代百科全书

正确答案:A

19.下列哪部百科全书是少年儿童百科全书。()

A.《不列颠少年百科全书》

B.《布洛克豪斯百科全书》

C.《中国大百科全书》

D.《不列颠百科全书》

正确答案:A

20.鸦片战争前后,中国的翻译主体主要有()三股力量。

A.教会出版机构、官方出版机构、民间商办出版机构

B.教会出版机构、官方出版机构、外国商办出版机构

C.教会出版机构、民间商办出版机构、外国商办出版机构

D.官方出版机构、民间商办出版机构、外国商办出版机构

正确答案:A

21.以“物竞天择,适者生存”为观点的《天演论》是由谁翻译的?()

A.严复

B.陈望道

C.林纾

D.梁启超

正确答案:A

22.在国家图书馆“联机公共目录查询系统”中,以“文化研究”作为题名检索词并且词邻近选择“是”的检索结果,会出现的检索结果是()。

A.中日文化交流研究

B.鲁迅文学研究

C.中印文学比较研究

D.中国文化研究

正确答案:D

23.西方四大经典百科全书是()。

A.《不列颠百科全书》、《社交词典》、《百科全书》、《拉鲁斯百科全书》

B.《不列颠百科全书》、《百科全书》、《拉鲁斯百科全书》、《美国百科全书》

C.《社交词典》、《百科全书》、《拉鲁斯百科全书》、《美国百科全书》

D.《不列颠百科全书》、《社交词典》、《拉鲁斯百科全书》、《美国百科全书》

正确答案:D

24.1895年甲午战争以前的译书主要集中在()方面。

A.社会科学

B.自然科学

C.宗教学

D.军事学

正确答案:B

25.中国现代百科全书编纂出版事业的真正发展,是()的编辑出版。

A.《日用百科全书》

B.《少年百科全书》

C.《中国大百科全书》

D.《简明中华百科全书》

正确答案:C

26.现代百科全书的奠基之作是()主编的《百科全书》。

A.托尔斯泰

B.狄德罗

C.伏尔泰

D.巴尔扎克

正确答案:B

27.在中国期刊全文数据库中,以字段词作为检索词进行检索称为()。

A.基本检索

B.类聚检索

C.二次检索

D.高级检索

正确答案:A

28.在中国期刊全文数据库中,与命中文献有相关关系论文的链接检索称为()。

A.基本检索

B.类聚检索

C.二次检索

D.高级检索

正确答案:B

29.()是一种全面记述事业的发展,系统汇集重要时事文献信息,逐年编辑、连续出版的资料工具书。

A.类书

B.百科全书

C.年鉴

D.表谱

正确答案:C

30.由学术性学会、协会主办,反映某一学科领域的学术活动、研究动态、研究成果、研究资料等的年鉴称为()。

A.政府年鉴

B.行业年鉴

C.学科年鉴

D.百科全书年鉴

正确答案:C

1.规范引证标注方法的原因

正确答案:

虽然它并不反映学术成果的内在学术含量,但却是外化内在学术含量的基本手段;虽然不能反映作者的全部水平,却可以反映作者的研究态度和学术积累;虽然不是学术研究和学术规范的全部内容,却是学术研究的必要条件和学术规范的起点;总而言之,它是接受过基本的学术训练的标志,是具有基本的学术素养的标志,是建立良好的学术道德的程序性制约。

请给分:

2.文献资源利用学术规范的基本原则

正确答案:

原则一:所有的专门性研究,都应该依据已有文献对相同或相关的研究成果、研究状况作出概略性的说明介绍原则二对已有文献任何形式的引用,都必须注明出处原则三原则上不采用间接引用的方式。间接引用,即一般所说的“转引”:引用第三者作品中所引用的内容。间接引用必须明确注明“转引自”。原则四 引用以必要、适当为限。原则五引用不得改变或歪曲被引内容的原貌、原义。原则六引用原则上使用原始文献。原则七引用原则上使用最新版本。原则八 引用标注应完整、准确地显示被引作品的相关信息。所谓相关信息,包括作者、题名、出版地、出版时间、卷期、页次等。原则九引用网络资源必须注意其“动态性”。网络资源的引用出处一般由网址和时间信息构成。时间信息是指网络资源的发布、更新或获取时间。单选题:(共30道试题,每题2分)

1.()和(),是中国古代类书的核心要义。

A.分类,陈列

B.分类,分述

C.陈述,陈列

D.分类,综合正确答案:A

2.类书在分类上一般按()的原则排比。

A.事居于前,文列于后

B.天人合一

C.抄录资料

D.区分胪列,靡所不载

正确答案:A

3.在“汉籍电子文献瀚典全文检索系统”中,要检索包含“君臣”但不包含 “父子”的诗文,输入的检索条件应该为()。

A.君臣|父子

B.君臣!父子

C.君臣?父子

D.君臣&父子

正确答案:B

4.《七录》把所有的典籍分为()大类型。

A.五

B.六

C.七

D.八

正确答案:A

5.“四部法”中将儒家经典和阐释儒家经典的著作归入()。

A.经部

B.史部

C.子部

D.集部

正确答案:A

6.()的最大特点,是精选宋元旧刻,明清精刻、抄本、校本和手稿本。

A.《永乐大典》

B.《百科全书》

C.《四库全书》

D.《四部丛刊》

正确答案:D

7.()是查考中国典籍流通传播的第二道重要关卡。

A.《汉书•艺文志》

B.《隋书•经籍志》

C.《七略》

D.《四库全书总目》

正确答案:B

8.()汇聚了先秦至清代乾隆年间以前中国最重要的传世典籍,是中国传统学术文化总结时期形成的最能体现传统文化概貌的巨著。

A.《永乐大典》

B.《百科全书》

C.《四库全书》

D.《四部丛刊》

正确答案:C

9.()最大的贡献之一是把不断完善的典籍分类体系改革最终定型于“经史子集”四部分类法。

A.《中经》

B.《七录》

C.《晋元帝书目》

D.《隋书•经籍志》

正确答案:D

10.综合性丛书不包括以下哪种类型的丛书。()

A.普通丛书

B.地方丛书

C.类编丛书

D.个人丛书

正确答案:C

11.百科全书的基本单元是(),它是百科全书输入和输出知识信息的基本单位。

A.词条

B.释文

C.条目

D.参考书目

正确答案:C

12.公元5世纪前的百科全书被称为()。

A.古代百科全书

B.中世纪百科全书

C.现代百科全书

D.当代百科全书

正确答案:A

13.西方四大经典百科全书是()。

A.《不列颠百科全书》、《社交词典》、《百科全书》、《拉鲁斯百科全书》

B.《不列颠百科全书》、《百科全书》、《拉鲁斯百科全书》、《美国百科全书》

C.《社交词典》、《百科全书》、《拉鲁斯百科全书》、《美国百科全书》

D.《不列颠百科全书》、《社交词典》、《拉鲁斯百科全书》、《美国百科全书》

正确答案:D

14.18世纪中期以后的百科全书的编者主要是()。

A.个人

B.修道院神职人员

C.多学科合作

D.单一学科

正确答案:C

15.1915年出版的(),在编排方法上,采用了“以字带词、分条释义”的体制,标志着中国历史悠久的字书迈进了现代字典、词典的阶段。

A.《新华字典》

B.《辞海》

C.《中华大字典》

D.《现代汉语词典》

正确答案:C

16.百科全书中,()是条目的标题,既是知识主题的概括,又是基本的检索标志。

A.条头

B.词条

C.释文

D.参考书目

正确答案:A

17.概述某一门类知识的百科全书称为()。

A.综合性百科全书

B.国家与地区性百科全书

C.专业性百科全书

D.少年儿童百科全书

正确答案:C

18.公元5世纪以后至18世纪初的百科全书被称为()。

A.古代百科全书

B.中世纪百科全书

C.现代百科全书

D.当代百科全书

正确答案:B

19.中国现代百科全书编纂出版事业的真正发展,是()的编辑出版。

A.《日用百科全书》

B.《少年百科全书》

C.《中国大百科全书》

D.《简明中华百科全书》

正确答案:C

20.从内容来看,近代以来的译书经历的两个发展阶段是以()为分界点的。

A.五四运动

B.第一次鸦片战争

C.第二次鸦片战争

D.中日甲午战争

正确答案:D

21.公元5世纪以后至18世纪初的百科全书的编者主要是()。

A.个人

B.修道院神职人员

C.多学科合作

D.单一学科

正确答案:B

22.18世纪中期以后的百科全书被称为()。

A.古代百科全书

B.中世纪百科全书

C.现代百科全书

D.当代百科全书

正确答案:C

23.现代百科全书的奠基之作是()主编的《百科全书》。

A.托尔斯泰

B.狄德罗

C.伏尔泰

D.巴尔扎克

正确答案:B

24.()是概述一切门类知识或某一门类知识的工具书,是历史上科学文化成就的总结性著述。

A.百科全书

B.类书

C.年鉴

D.书目

正确答案:A

25.国家图书馆“联机公共目录查询系统”的检索功能不包括()。

A.单一字段检索

B.所以字段检索

C.跨库检索

D.任意4个不同字段的逻辑组配检索

正确答案:D

26.鸦片战争前后,中国的翻译主体主要有()三股力量。

A.教会出版机构、官方出版机构、民间商办出版机构

B.教会出版机构、官方出版机构、外国商办出版机构

C.教会出版机构、民间商办出版机构、外国商办出版机构

D.官方出版机构、民间商办出版机构、外国商办出版机构

正确答案:A

27.中文期刊全文数据库网络版的基本使用方法是()。

A.论文资料下载、论文资料检索、使用专用阅读器阅览

B.论文资料检索、使用专用阅读器阅览、论文资料下载

C.论文资料下载、使用专用阅读器阅览、论文资料检索

D.论文资料检索、论文资料下载、使用专用阅读器阅览

正确答案:D

28.在中国期刊全文数据库中,与命中文献有相关关系论文的链接检索称为()。

A.基本检索

B.类聚检索

C.二次检索

D.高级检索

正确答案:B

29.电子版年鉴与印刷版年鉴的区别在于()。

A.添加应用工具

B.弱化检索功能

C.减少检索功能

D.减少应用工具

正确答案:A

30.()是一种全面记述事业的发展,系统汇集重要时事文献信息,逐年编辑、连续出版的资料工具书。

A.类书

B.百科全书

C.年鉴

D.表谱

正确答案:C

1.试述百科全书和百科词典、类书的差异。

正确答案:

百科全书和百科词典的差异:从发展流变来看,百科词典是一般词典与百科全书相互影响和渗透的产物。百科词典在内容上向“百科”扩展,但是基本性质和编纂方法仍然坚持词典的形式。百科词典的内容主要是提供语言知识和定义描述;百科全书的内容是对概念或知识主题历史、现状、未来的全面概述,强调基本事实、数据、资料的翔实准确,追求完备性与系统性。百科全书和类书的差异:类书是对已有文献资料的抄录与编辑,“分类”和“陈列”是其明显特征。类书是知识和文献的积累与总结,是体现述而不作观念的资料长篇。百科全书则是对已有知识的时代性理解与概述,反映的是编者所处的时代的认识水平和思维成果。百科全书注重工具性,方便一般人查考;而类书注重体系化,把分散的文献资料归类,检索功能弱。百科全书产生于西方文化背景下,类书则产生于中国传统文化中。

请给分:

2.古籍目录的特点

正确答案:

信息检索作业 篇2

人的一生都在不断地学习, 然而善于学习比起纯粹地学习更为重要, 善于学习不仅是一种能力, 而且是未来时代的必备要求之一。尤其是在信息时代, 善于学习才能更好地迎接新的挑战, 适应社会的发展与变化。如今, 信息技术日新月异, 生活与互联网紧密联系, 人们可以在网络上搜索大量的信息, 于是“搜商”这一词渐渐出现在人们的视线中并获得了更高的关注度。搜商不仅能帮助人们解决生活中遇到的问题, 还能影响人们的生活水平和生活质量。

1 初步了解信息检索与利用

搜商的含义, 即有效率地搜寻资源、解决问题的素养和能力。搜商的核心是搜索的意识和能力。在《信息检索与利用》的第一节课中, 初次接触到搜商, 了解信息检索与利用这门课程的主要内容和作用, 发现学会了这门课程对我的专业有很大的帮助, 能够解决专业上和学习上的问题。同时我也对搜商产生了浓厚的兴趣, 在接下来的一次次课程中, 揭开了搜商的神秘面纱。在课后实践过程中, 学会利用课堂上学到的知识来解决学习上的困难, 尝试搜商的各种功能得到不同的搜索结果, 更深层次地学习搜商, 提高了搜商能力。

2 信息检索与利用的学习过程

第二节课中, 学习了图书馆信息资源的使用, 原来图书查询不用到图书馆一本本翻阅才能找到想要的那一本书, 为了节省时间和提高效率, 登录学院图书馆主页, 在搜索框中输入相关书籍的书名、作者、索取号来获取书籍的相关信息, 记下索书号和馆藏地点, 就能快速到图书馆找到这本书。在图书馆主页中进入数据库导航, 有中文数据库和外文数据库, 中文数据库有中国知网、读秀知识库、超星数字图书、书生数字图书、方正Apabi电子图书等。中国知网主要是论文和期刊资源, 其他的可以浏览电子图书, 这样就不需要购买书籍或是到图书馆借阅, 直接在网络上打开相关网址, 下载相关阅读器, 就可以阅读想要看的电子书籍。这样, 阅读就不会受到地点、时间、空间的限制, 打开了人们阅读的另一扇“窗户”。

中文数据库里还有超星名师讲堂、新东方多媒体学习库、超星发现等。超星名师讲堂主要是讲师视频, 与浏览电子书相比较, 看视频学习更能让人浅显易懂, 而不显得枯燥无味。新东方多媒体学习库主要是学习英语, 比如英语四级考试, 我就可以到新东方数据库找到学习英语的相关资源, 英语四级的真题及解析答案或是英语高分的攻略技巧。超星发现是检测论文重复率, 有时老师布置论文需要检查论文重复率, 那么就可以到超星发现检测。中文数据库还有其他的功能等待我慢慢挖掘, 除了老师讲解的内容, 还有其他的用途等着我实践与应用, 这也是搜商能快速提高的一种方法。

第三节课中, 老师介绍了中国图书馆分类法, 简称《中图法》, 分为五个基本部类, 22个基本大类, 所有图书是按《中图法》给出的分类号排列。我学会了如何看图书的索取号和图书馆的排架原则, 这样在知道图书的索取号后, 很快就能到图书馆找到这本书, 而不是毫无方向的四处打转, 浪费了大量时间还找不到自己需要的书籍。第四节课的主要内容是中国知网的使用方法和搜索技巧, 先学习了如何进入和登陆中国知网, 其次是搜索方法, 快速而有效地找到自己需要的资源, 比如跟踪名人学者, 找到他们发表的论文以及几种导出论文的方式。最后, 我了解了投搞论文的方法和建设个人数字图书馆, 并尝试建设自己的数字图书馆, 将理论和实践相结合, 对搜商的应用有了进一步的了解。

第五节课是关于期刊论文的撰写, 老师讲了论文的基本构成与要求和参考文献的书写格式以及大雅论文相似度检测。之前我不了解怎样才能写出一篇好的论文, 学了这门课程后, 我知道了论文的构成要素和搜索相关的论文资源, 参考别人的论文成果, 然后自己就可以写出一篇论文了。老师又介绍了中国期刊网, 主要有龙源期刊网、万方数据库和维普数据库。如果想看期刊杂志, 就可以不用到图书馆借阅或将期刊买回来翻阅, 只要自己到这三个数据库, 查询想看的期刊花费少量的资金就可以看到自己喜欢的杂志。还可以在数据库上检测论文相似度, 以前只知道在淘宝上检测论文, 现在学会了多种检测论文的方法。

第六节课主要是电子图书的检索与利用, 可以在网络上阅览电子图书, 一种是在图书网站上检索书籍, 另一种是在图书数据库上检索学术方面的书籍。我学习了如何在超星数字图书高级检索电子图书, 从中进入读秀知识库浏览电子图书, 有效率地搜寻和利用电子资源。另一节课学习了其他数字图书馆的高级检索与中国国家图书馆的图书检索和公开课, 接下来老师讲了百度高级检索技巧, 每一个技巧对我搜索信息有很大的帮助并且节省了一定的时间, 让我有更多的空余时间做自己喜欢的事情。

3 信息检索与利用的心得体会

之前我一直认为在学习知识方面需要读很多的书, 大脑要记住很多的知识, 然而互联网发展, 信息在不断地更新, 我发现需要学习的知识太多, 需要了解的范围太广泛。现在, 我学习了《信息检索与利用》这门课程, 发现自己能够运用一些搜索技巧以及找到解决问题的有效方法。通过课上学到的知识, 运用到生活中, 在图书馆借了一本书名为《我的搜主意比你多》, 作者黄泰山将他搜索的经验与读者分享, 所以我对搜商有了进一步的认识, 发现传统的独立思考效果也会受到限制, 独立思考只有个人的力量, 需要花费大量的时间才能解决问题。有时候没有那么多的时间, 难道就不能解决了吗?我为什么要花比别人多一倍的时间才能完成任务呢?

搜商除了可以帮助我解决问题以外, 还可以提高我的智商、情商和成功的概率。在我的专业领域, 多少接触过一些相关信息, 但我更加需要找到这个领域内最有价值的信息, 而不仅仅是相关信息。在第七节课中, 学会用不同的搜索引擎有效地得到信息资源。而我明白了搜索不仅仅是一件供人利用的工具, 还是检索到有效方法解决问题的路径。掌握了搜索技巧, 我在完成专业作业时, 设置准确的关键词, 利用相应的搜索引擎, 获得自己想要的信息, 快速地完成了作业。不仅在专业领域的学习, 想要提升其他能力, 搜商可以助你一臂之力, 搜索资料认识能力, 学习和研究经典案例, 找到提升能力的方法, 对该领域的最新研究成果、动态发展的了解, 也可以依托搜商获取最新的信息和资源。

4 总结

总的来说, 学习这门课程, 就像拿到一把开启知识库大门的钥匙。无论你欠缺哪方面的知识、技能, 都可以上网寻求帮助, 获得学习资源。在这个有互联网的时代, 每一天都在变化, 信息也在更新换代, 而我们也需要变化, 积累更多的知识, 适应未来的变化发展。搜商的学习不会止步于此, 每天学习一点, 未来收获更多。

参考文献

中文信息检索关键技术分析 篇3

关键词:信息检索;搜索引擎;网络爬虫;中文分词;排序

中图分类号:TP393文献标识码:A文章编号:1009-3044(2007)15-30770-02

Analysis of the Key Technology of Chinese Information Retrieval

WANG Dong

(Dept of Computer Science & Technology, Qiongzhou College, Wuzhishan 572200, China)

Abstract:The paper makes a brief introduction on the Web Chinese Information Retrieval, and analyses some key technology on it. And the Chinese search engine technology popularly at present has been turned out. The author proposed some ideas, the experiences and the tentative plans, and eventually carried on the forecast on the intelligent Chinese search engine technology.

Key words:Information Retrieval;Search Engine;Web Crawler;Chinese Participle;Arrangement

1 引言

近年来,Internet迅速发展成为一个分布于全球的混合信息空间。为了帮助用户获得网络上的丰富信息,Web信息检索系统应运而生,其最新发展趋势是检索的智能化和垂直化。人们在享受信息检索工具带来方便的同时,“忠实表达”和“表达差异”等问题日益突显出来。随着人工智能、机器学习、语义Web等技术的快速发展,人们提出了智能化搜索引擎来解决传统搜索存在的弊端。下面笔者就Web中文信息检索的智能化技术提出自己的一些看法。

2 Web中文信息检索概述

WWW上的信息检索主要研究对整个HTML文档信息的表示、存储、组织和访问,即根据用户查询要求,从信息数据库中检索出相关信息资料,以文本数据为主要处理对象,提供根据数据资料的内容而不是外在特征来实现的信息检索手段。[1]

在Web信息检索技术领域,英文信息检索发展得较为完善,如信息的表示采用向量空间方法,基于内容相关性的查询反馈等。Web信息检索的发展是一个不断探索的过程,如今它己向第二代发展,功能也越来越强大[2]。然而,目前中文网络信息检索还存在着许多问题:1、查询方式单一,查准率和查全率不高。中文搜索引擎一般只有分类目录浏览和简单的关键词检索,缺乏高级的查询方式。但是中文是一种存在着大量音、形、义相近词汇的复杂语言,单一的检索方式经常会使得使用者得不到想要的结果;2、中英文混合检索问题。如:当你输入“MP3”时,有些网站会认为你在查找英文网页,进而自动将你送到一个英文搜索引擎上;3、专业的网络信息检索引擎较少;4、中文网络检索的相关性无法与英文媲美,检索字串与网页中文字的简单匹配并不见得就是语义上的匹配。

3 Web中文信息检索的关键技术

3.1 网络爬虫

网络爬虫(Crawler)是通过网页的链接地址来寻找网页的程序,它从网站的某一个页面开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。网络爬虫一般有两种策略:深度优先和广度优先[3,4]。深度优先是指网络爬虫会从起始页开始,逐个链接跟踪下去,处理完这条线路之后再转入下一个起始页,继续跟踪链接。广度优先是指网络爬虫会先抓取起始网页中链接的所有网页,然后再选择其中的一个链接网页,继续抓取在此网页中链接的所有网页。第二种方式可以让网络爬虫并行处理,提高其抓取速度。网络爬虫抓取HTML文档时,需要把HTML标识符过滤掉,同时记录页面的版式信息,例如文字的大小、是否标题等,这些信息有助于计算单词在网页中的重要程度。

3.2 中文自动分词技术

对中文来讲,自动识别汉语文献中词的边界,将书面汉字序列切分成正确的词串,是理解自然语言的第一步,分词质量的好坏将直接影响到主题抽取的质量。现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。

本文主要说明一下基于统计的分词方法,此方法一般不依赖于词典,因此也称为无词典分词法。该方法根据计算字与字相邻共现的频率来确定是否成词,共现信息体现了汉字之间结合关系的紧密程度,当紧密程度高于某一个阈值时,便认为此字组可能构成一个词。这种方法只需对语料的字组频度进行统计,不需要分词词典。但它也不足,比如说像“之一”、“有的”等词它们尽管不是词组,但一起出现的概率也很大,这样就会对词组分词产生一些偏差[5]。改进的方法是:先使用一部基本的分词字典进行关键词分词,同时使用统计方法识别一些新的词组,即把词频统计和字典方法结合起来,这样两者可以相得益彰,效果更好。此外,还可以把得到的搜索结果进行动态的归类,有条理地给出搜索结果,这样可以让用户清楚地寻找自己的搜索内容属于哪个类,节省用户在大量的搜索结果中查找所需信息的时间。

很多搜索引擎对中文的“一词多义”都束手无策。在这种情况下,我们可以采用系统和手工干预相结合的办法来解决这个问题。首先,系统查找知识库并得到搜索词的所有含义,同时进行相应的排序,而后系统把搜索词的各个含义以网页的形式呈现给用户。用户就可以选择自己感兴趣的含义。该方法避免了对关键词的曲解,同时避免了大量垃圾信息产生,因此极大地提高了查找效率。特别是在个性化搜索引擎方面,系统可以增加用户对个性数据库反馈的功能,这样当该关键词下一次出现的时候系统就会把用户的这次选择作为其默认选项。

3.3 搜索结果排序

传统的PageRank算法的工作机理是:若一个页面被多个页面引用,则这个页面可能是重要页面;一个页面尽管没有被多个页面引用,但被一个重要页面引用,那么这个页面也可能是重要的。在此基础上,我们可以进一步提出一些设想:1、某位用户所搜索的信息可能只涉及的某个领域,因此在使用PageRank算法时,可以考虑用户感兴趣的领域。例如,如果网站是介绍“电器”的,有10个链接都是从“电器”相关的网站链接过来,那这10个链接比另外10个从“体育”相关网站链接过来的贡献要大;2、网页设计者经常会根据强调内容的不同,给网页的不同部分加上不同的标记或用不同的字体等。因此,我们就可以根据页面版式信息来确定所搜索的结果和搜索词的相关程度;3、我们发现,当用户打开搜索结果中的某个页面,如果发现该页面没有他想要的内容,他就会立刻关闭;而如果有他要查找的内容,他则会驻留比较长的时间。因此可以采用用户在某页面的停留时间,作为搜索结果排序的参考之一。

目前的搜索引擎排序算法上还存在两大不足:1、正解相关性。相关性是指搜索词和页面的相关程度。仅仅通过链接、字体、位置等表面特征,并不能真正判断搜索关键词与文章的相关性。另外,很多文章尽管没有出现搜索词,但是文章表达的意思却与搜索词相关,这时搜索引擎将无法搜到这些相关网页。可见,表面特征搜索只能治标,而不能治本。解决问题的关键在于增加语义理解,让机器明白人的意图;2、搜索结果的单一化。在搜索引擎中,任何人搜索同一个词都会得到同样的结果。比如说用户输入搜索词“苹果”,如果用户是一个IT工作者,他也许想找到的是苹果计算机;而对于一个农民而言,他也许想找到的是如何栽培优质苹果的方法。而当前的搜索引擎尽管在个性化方面有了一些尝试,但距离人们想要的真正意义上的“个性化”还有很大的差距。

综上所述,搜索引擎的排序技术将会向两个方向发展,即:语义相关性和排序个性化。如果一个搜索引擎能从根本上解决这些问题,它将成为搜索领域的霸主。

4 Web中文信息检索的发展趋势

近年来,信息检索技术开始注重网页质量与相关性的结合,这主要是通过三种手段:1、对网上的超文本链接结构进行分析,如Infoseek和Google;2、对用户的点击行为进行分析,如Directhit;3、与网站目录相结合。信息检索最新的趋势是智能化(包括个性化),智能信息检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索。搜索引擎的智能化还表现在用自然语言与用户交流的能力,对知识的理解和处理能力。目前Internet 上的人工智能产品越来越多,如:智能搜索引擎、智能浏览器、学习智能体、知识共享智能体等已经从实验室进入市场[6]。

5 结束语

本文介绍了Web中文信息检索技术的基本理论,在此基础上,分析和研究了中文搜索引擎的三大关键技术:网络爬虫、中文分词、搜索结果排序,并就中文分词和搜索结果排序提出了一些设想。我们深信:随着互联网技术的不断发展,搜索引擎也将迎来革命性的变革,人们将在这个信息爆炸的年代里获得越来越精确和及时的信息。

参考文献:

[1]Venkat N Gudivada. Information Retrieval on the World Wide Web[J]. IEEE Internet Coputing,1997,(4):58-68.

[2]翁惠玉,马范援,朱义军,杨传厚. 网络搜索引擎的现状分析[J]. 情报学报,1999,18:100-102.

[3]李学勇,欧阳柳波,李国徽,钟敏娟. 搜索引擎中网络蜘蛛搜索策略比较研究[J]. 计算机技术与自动化,2003,22(04):63-67.

[4]李学勇,欧阳柳波,李国徽,王鑫.专业搜索引擎搜索策略综述[J].计算机工程,2004,30(13) :32-33.

[5]唐培丽,胡明,张勇. 基于中文文本主题提取的分词方法研究[J]. 吉林工程技术师范学院学报,2005,21(2):34-36.

信息检索作业 篇4

一.检索下列图书(要求提供基本书目项:书名、著者、出版项等)1.一本美国前总统的自传或回忆录 2.论中日关系的书

3.Bowker公司出版的一本美国政界名人录

4.可买到的《安娜.卡列尼娜》的英译本是由哪几家出版商出版的? 5.拳王阿里的传记

6.关于日常生活中的食品安全的书

7.老舍所著《骆驼祥子》或《四世同堂》的英译本书名和出版社。8.信息经纪人手册、必读一类的书

二.期刊信息检索

1.英国出版的有关无机化学的期刊有哪几种?

2.查出美国Academic Press出版社出版的有关毒物学(toxicology)的期刊的刊名、ISSN号、价格、刊期等。

3.查出下列主题(选3)的期刊论文(文摘或全文)各一篇:青少年网络安全、网络安全技术、教学中的数学游戏、竞争情报、专利战略、英国环境政策、人工智能与残疾人康复、亚洲经济形势分析、入世后的中国保险市场、清洁能源的开发。

4.选择一个感兴趣的领域(如:计算机技术、家庭教育、军事武器),调研其在网上可阅读到的中外期刊(刊名、网址)。

三.会议及会议文献,机构信息、科技报告的检索

1.查出下列领域(选一)今年将召开的国际性学术会议:数字图书馆、信息检索、远程教育、医学图象处理、气候变化;(会议时间、地点、主办机构及网站)。2.查出上述主题(选2)会议文献、学位论文各一篇。

3.查出下列国际组织机构(选一)的网站以及其创办时间、宗旨及常规出版物:IMF、FAO、WIPO、国际卫星组织。

4.查出英国图书馆、美国政府出版局GPO的概况。

5.查出摩托罗拉(或宝洁、爱立信、索尼)公司概况。

6.查出下列主题(选一)的科技报告一篇:智能交通、智能建筑、清洁能源、网络安全。

四.专利信息检索

1.查出下列内容主题的专利1、2件,并查其是否有同族专利:

多人骑乘的自行车、能上下楼梯的轮椅、自动开关的路灯、阻燃的消防衣、交通控制设备。2.查出下列公司或机构(选一)所拥有的相关内容的专利:

P&G的环保洗涤用品、爱立信的手机电池、Sony的高清晰度彩电

五.标准检索

查出下列主题(选一)的国际、国内、行业标准各一件:

碳酸饮料、空气质量、建筑材料、六.百科知识检索

1.简述滑铁卢之战的过程

2. 十字军东征前后共有几次?

3.二次大战末美国在日本广岛和长崎投放两颗原子弹的时间及造成的伤亡人数。4.核反应堆第一个发明人是谁?现有哪些国家拥有核装置? 5.有关周恩来的生平资料

6.关于金字塔(或玛雅文明)

七.人物信息检索

1.美国第一任国防部长是谁,怎样死的? 2.盲文的英文叫什么?从何而来? 3. 波音客机以谁命名?简述其生平。

4. 查出几位研究中国地理的美国学者,其学历、职称。5. 刺杀美国总统肯尼迪凶手的生平。6. 何谓寇松线,寇松的生平。

7.你感兴趣的某位电影明星生平。

8.杨振宁的学历、研究成就,何年获何项诺贝尔奖?

八.地理信息检索

1.过去国外称我国的地名有:Mukden、Kalgan、Marco Polo Bridge、Khanbalik、Cathay各指何地?

2.阿拉伯河的英文名称是Shatt al Arab,其中Shatt是何意? 3.岛屿在英、法、德语中分别是什么词? 4.羽毛球的英文名称从何而来?

5.日本北方四岛的英文名称分别是什么? 6.与北京同一纬度的中外城市有哪些?

7.哪一个国家的首都位于经纬度最接近于零? 8.查出阿富汗的首都的人口、经济状况。9.在网上查出以色列的国旗、国歌、地图。10.查到一幅对你有用的地图。

九.统计性信息检索

1. 历届奥运会男子100米赛跑的最佳成绩是多少?.1903、1987、1997年诺贝尔物理奖获得者是哪几位?何国人? 3.伊朗阿巴丹市的人口数。

4.查英国Tudor王朝的最后一个国王是谁?

5.历史上有记载的死亡人数最多的一次地震发生在何年?何国?何地? 6.美国哪一州的离婚率最高?哪一个州的平均个人收入最高? 7.世界铁路货运量哪个国家最高?

8.美国第一次人口普查时(1790年)的全国人口数量是多少?

9.100多年来,在美国的中国移民哪一年人数最多?这一年美国会通过了有关华工的什么法案?

10.最早有在校大学生统计的是哪一年?当时哪国大学生最多? 11.1911年中国和印度铁路通车里数各是多少?

12.世界上钻石产量最高的是哪一国?占世界总产量的百分比是多少? 13.查出英国 人均消费茶叶的数量。

十.搜索引擎检索实习题

1.某人要去ATLANTA, GEORGIA 做公务旅行,要求提供餐馆指南。2.查一个机构“Star Trek Forum”的官方名称和official homepage。3.找供应宠物食品的公司的网站。

4.音乐迷想了解滚石乐队(“Rolling Stones“)这年度或下年度巡回演出的地点和购票网站。5.找到宾夕法尼亚大学癌症治疗中心的关于乳腺癌的治疗的网站。

6.在网上找到Felten & Wallach关于Java Script的安全性的文章(《Java:From HotJava to Netscape and Beyon》)

7.关于各种媒体的稳定性(media stability)的论述,有一个机构National Media Laboratory专门针对此问题设立了网站,请查找该网站。

网络资源与信息检索作业样板 篇5

1、检索课题名称:雾霾的成因防御及治理

2、课题分析:本课题旨在研究雾霾的形成过程及它的危害。其中“雾霾”“成因”和“治理”为课题的表层概念,因为“成因”和“治理”这两个概念过于宽泛,所以不作为检索词来使用。进一步分析“雾霾”这个概念的同义概念有“pm2.5”、“空气颗粒物污染”、考虑将其纳入检索词中。“防御”的隐含概念包含“预防”、“防范”等含义,故将这两个词也列为检索词。

3、选择检索工具:

维普资讯网(外网)— 期刊文献数据库; CNKI数据库(外网)文献数据库; 超星图书数据库 — 图书数据库

4、构建检索策略:

检索算法(雾霾+pm2.5+空气颗粒物)*(防御+防范)*治理

时间范围:因为要做定题检索,所以时间上不要求最新,初步限定在2000以后。文献范围:

文献的类型范围--选择期刊、毕业论文、图书三个不同类型。

5、简述检索策略调整的过程:(1)维普资讯网

A、在维普资讯网选择“高级检索”,选择“文摘”字段,在检索框中输入检索词“雾霾+pm2.5+空气颗粒物” 第二行检索框中输入检索词“防御+防范”选择“关键词”字段,在检索框中输入“治理”,三组检索词之间选择逻辑关系“并且”进行组配。时间范围限定在“2000-2013” ;只有一篇。

(2)CNKI博硕士毕业论文数据库

A、在CNKI外网,选择“文献”字段,检索全文。时间范围限定在“2000-2013”

B、256条记录作为课题需要浏览的文献数量来说过多,进一步调整检索策略,将同意概念的检索词“PM2.5”和“防范”去掉,将所有检索词都限定在“题名与关键词”字段中,时间范围和专业范围不变,检索出来101条记录。

C、101条记录还有些多,还需进一步调整。选择在结果中检索,将期刊范围在“核心期刊”中,这次检索结果为28条记录,比较满意。

(3)超星读秀学术搜索平台

A、在全文字段没有相关文献 B在关键词里搜索“雾霾”“防御”有三篇文献

6、标示原文线索:(1)维普资讯网

题名:靖江市大气环境颗粒物污染的预防和治理

作者:吴楠 出处:《北方环境》2013年第5期(2)CNKI外网期刊数据库

题目:《我国雾霾成因及治理的思考》

作者:张小曳 孙俊英 王亚强 李卫军 张蔷 等 出处:科学通报 2013/13(3)超星读秀学术搜索平台 题目:《浅谈雾霾天气的危害级防御措施》

作者:王壬,尹博文

出处:华人时刊 出版日期:2013 期号;第3期

第二次作业

一.检索课题名称:雾霾的成因防御及治理

二.课题分析:本课题旨在研究雾霾的形成原因以及它的防护和治理措施。其中“雾霾”,“成因”,“治理”,为课题的表层概念。进一步分析“雾霾”这个概念词主要指在日常生活中的“固体颗粒物”或“PM2.5”将其纳入检索词中“防御”的隐含概念包含“防止”,“抵御”等含义,故将这两个词也列为检索词。三.关键词:雾霾 PM2.5 治理 防御 四.选择搜索引擎

1谷歌学术搜索(Google)2百度(Baidu)五.构建搜索策略: 检索算法:(雾霾+PM2.5)*成因 *(防护+防止)*治理 构建检文献范围:期刊论文、学位论文、会议论文、专著 六.简述检索策略调整的过程 1)谷歌学术搜索(Google)a.使用“(雾霾+PM2.5)*成因 *(防护+防止)*治理”检索运算式,搜索范围为所有网页,约有24900项结果。

b.考虑到检索结果很多,调整检索策略如下:使用检索式“雾霾*成因*治理”,限定年份为2012年以后,得到检索结果约有2320条,且相关性较好。2)百度

a.使用“雾霾+PM2.5)*成因 *(防护+防止)*治理”检索运算式,百度一下,找到相关网页约760篇。

b.上述检索结果不是很多,但与要找的相关性不是很好,调整检索策略如下 在百度中输入以下字符“雾霾的成因防御及治理filetype:doc”找到相关结果101个,并且与想要找的相关性较大,比较满意。七.标示原文线索:(1)谷歌

题名:我国雾霾及其治理的思考 作者:张小曳①*, 孙俊英①, 王亚强①, 李卫军②, 张蔷③, 王炜罡④, 权建农③, 曹国良⑤, 王继志①, 杨元琴①...(2)百度

题名:浅谈雾霾成因及治理 作者:周蓉

出处:中国学术期刊网

检索课题名称: 雾霾的成因及治理课题研究

课题分析:

本课题旨在研究雾霾成因和治理两方面的内容。其中“雾霾”“成因”“治理”为课题的表层概念。同时,由于“课题研究”这一概念过于宽泛,在检索时不建议作为关键词。综上所述,我们得出如下检索词

中文关键词: 雾霾 成因 预防 治理

英文主题词: haze cause governance 选择检索工具: 《美国工程索引》(Ei village)

构建检索策略:

检索策略 haze*cause* governance

检索范围:所有数据库,时间不限

检索策略调整:

A.在检索页面第一行输入“haze”检索式,检索范围为“主题”,第二行输入“cause”,第三行输入“governance”,检索范围同样为“主题”,时间跨度为所有年份,检索语言为自动,点击检索,检索结果显示,近似值为9项。

B.调整策略:仍利用上述检索式,把controlled vocabulary限定为Air Quality,再次检索,检索结果显示为6条。表示原文线索(2条): Regional haze modeling over the VISTAS States: Preliminary verification of models-3/CMAQ for the 2002 annual period Morris, Ralph E.(ENVIRON International Corporation, 101 Rowland Way, Novato, CA 94945);McNally, Dennis;Tesche, T.W.;Tonnesen, Gail;Boylan, James;Brewer, Patricia Source: Regional and Global Perspectives on Haze, 134 VIP, p 643-662, 2004, Regional and Global Perspectives on Haze: Causes, Consequences and Controversies Visibility Specialty Conference Database: Compendex Mitigation for regional haze impacts: Cleaning up smoldering coal refuse piles with CFB boilers Campbell, Bill(ENSR Corporation);Campbell, William;Paine, Robert;Shea, David Source: Electric Utilities Environmental Conference, EUEC 2005: 8th Annual Joint EPA, DOE, EEI, EPRI Conference on Air Quality, Global Climate Change and Renewable Energy, v 2006, 2006, Electric Utilities Environmental Conference, EUEC 2005: 8th Annual Joint EPA, DOE, EEI, EPRI Conference on Air Quality, Global Climate Change and Renewable Energy Database: Compendex

一,检索课题名称: 雾霾的成因及治理课题研究

二,课题分析: 本课题旨在研究雾霾成因和治理两方面的内容。其中“雾霾”“成因”“治理”为课题的表层概念。同时,由于“课题研究”这一概念过于宽泛,在检索时不建议作为关键词。综上所述,我们得出如下检索词

三,中文关键词: 雾霾 成因 预防 治理

英文主题词: haze AND cause AND governance 四,选择检索工具:Elsevier 数据库

五,构建检索策略:haze*cause*governance

六,检索过程及策略调整:

A.

在全部文献资源中检索“haze AND cause AND governance”,检索到79篇相关文献。

B.

限定主题“air quailty” 检索到3篇相关文献。

七,全文摘录一篇:

篇名

Science–policy data compact: use of environmental monitoring data for air quality policy 著者

Jill A.Engel-Cox

Raymond M.Hoff

著者机构

a Marine Estuarine and Environmental Science Program, University of Maryland, Baltimore County, 1000 Hilltop Circle, Baltimore, MD 21250, USA b Battelle Memorial Institute, 2101 Wilson Boulevard, Suite 800, Arlington, VA 22201, USA

文摘 Abstract Environmental policies often strongly depend on environmental monitoring data, yet these increasing datasets are not always used effectively in enacting and implementing public policy.We propose a science–policy data model that denes the conditions that facilitate the use of environmental monitoring data for policy and which could help scientists and policymakers diagnose impediments in the link between science and policy and work more effectively together to use monitoring data in environmental policy.The model includes two parts:(1)criteria for scientic monitoring data to become useful information for public policy;(2)a ‘‘data compact,’’ a relationship between senior

scientists and midlevel policymakers that enables translation of environmental monitoring data into knowledge useful for public policy.We compare the model against two case studies in the air quality literature: ozone depleting substances and acid precipitation.Finally, we use the model to assess the potential of a newly developing area that we are researching, use of satellite remote sensing data for ne particulate matter transboundary policy.# 2005 Elsevier Ltd.All rights reserved

关键词

Keywords: Policy model;Environmental policy;Data compact;Air quality;Satellite

正文

首段

1.Introduction: environmental policy and scientic data Environmental policy, concerned with human health and the natural environment, depends on data that describe

environmental conditions, such as air quality, water quality, hazardous chemical contamination, and land use.Fischer(2000)has proposed that environmental problems are different than other social policy issues, since they are argued more on scientic ndings than on moral issues: ‘‘Although they are generally traceable to human agents, environmental problems have an imposing physicality compared to other social problems.’’ Environmental politics in the U.S.began as conservation with President Theodore Roosevelt, but its modern political form began in the 1930s, when the Franklin Roosevelt administration addressed deforestation, soil erosion, ooding, protection of ora and fauna, and other areas that required information about the effects of human activity on the natural environment(Sussman et al., 2002).When modern environmental legislation, such as the Clean Air Act, Clean Water Act, and Endangered Species Act were passed, each required extensive scientic environmental monitoring to set standards and monitor progress.Environmental policy from the 1960s to the present has increasingly depended on environmental monitoring and the analysis of the monitoring data 尾段

Acknowledgements The authors would like to acknowledge general sponsor-ship of past science–policy work in this arena from U.S.EPA, NASA, and NOAA.RMH receives support from the NOAA Center for Remote Sensing Science and Technology(CREST)and from a NASA Grant from Langley Research Center.Special thanks to Dr.Royce Hanson and Dr.Douglas Whelpdale for their comments and input on an early draft of the manuscript, and to Ms.Nikisa Jordan for helping with the satellite image.Thanks also to two anonymous reviewers for their comments and insight

信息管理中的中文信息检索 篇6

一、信息检索简介

1. 概念

广义的信息检索范围很大, 可以说从书本、报纸以及其他的各种媒体中查找人们需要的信息都可以称为信息检索。

狭义的信息检索是特指利用计算机这个高效的工具对各种信息进行检索的技术。信息检索的内容包括文本、图像、视频和音频等多种, 但本文只讨论文本信息的检索技术, 特别是中文信息的检索技术。

信息检索是一门研究从一定规模的文档库 (D o c u m e n t Collection) 中找出满足用户提出的信息需求 (User Information Need) 的技术。

2. Web信息检索

Web的出现大大地促进了信息检索技术的发展。Web上有异常丰富但又十分混乱的信息资源, 其中绝大部分有用的信息还没有挖掘出来。这是因为目前还没有特别好的信息处理和检索工具。这一领域的开发仍然处于初级阶段。

3. 中西文信息检索比较

在文本信息检索领域, 西文信息检索的发展较为迅速。西文信息检索系统可以利用向量空间表示检索信息内容, 并将自然语言处理应用于信息检索, 大大提高了信息检索的准确性。中文信息的检索和英文信息的检索在很多地方是一致的, 但也有一些不同。比如中文词语之间没有空格, 因此在索引前需要进行词语切分。此外, 与英文相比, 汉语句法分析和语义理解更为困难。

4. 信息检索的模型

一般有两种信息检索模型:基于统计的模型和基于语义的模型。基于统计的模型是应用某些统计的手段从被检索文档和高标注等级文档中查询与用户需求匹配程度最好的文档;而基于语义的模型则尝试对需求实现一定程度语法语义分析, 即对自然语言文本进行一定程度的理解并重新生成查询。

基于统计的模型主要有:布尔模型 (Boolean Model) 、扩展布尔模型 (Extended Boolean Model) 、向量空间模型 (Vector Space Model) 以及概率模型 (Probabilistic Model) 等。

二、向量模型

向量模型是重要的检索模型, 其主要优点在于:a、通过对特征项的加权改进了模型的检索效果;b.模型的部分匹配策略允许检索出与查询条件相接近的文献;c.相似度的引进使得能够对查询结果进行排序, 以倒排文档方式提交结果。

1. 文档和项的向量空间表示

首先把一个文档进行分词处理, 并去除那些停用词, 如“我”、“的”、“人们”等。然后对剩余的词进行合并处理。

在一个给定的集合中先对每个文档进行以上的操作, 获得每个文档索引项的集合。再把所有文档的索引项进行合并, 形成了一个代表整个文档集合的索引项集合, 整个索引项集合表示了一个“空间”。在一个文档空间中, 可以给每个索引项赋一个权值, 代表这个索引项在这个文档中的地位。如表1所示, 文档1的向量空间是 (3, 4, 5) , 文档2的向量空间是 (2, 3, 3) 。

与文档空间相对应的一个概念是“项空间”, 它是指一个索引项在文档集合中的各个文档权值的集合。如表1所示, 索引项“经济”的向量空间是 (4, 3, 0, 0) , 索引项“金融”的向量空间是 (5, 3, 0, 5) 。

于是文献和查询均可用由项构成的向量来表示:d= (t1, t2, ……, tn) 。项的权重 (term weight) :对于有n个不同的项的系统, 文献D= (t1, t2, ……, tn) 。

2. 项权值

项t k (1≤k≤n) 常常被赋予一个数值Wk, 表示它在文献中的重要程度, 称为项t k的权重。因此, 我们一般用D= (w1, w2, …, wn) 的形式表示文献。特征项的权重计算, 是人为赋予的, 因此主观性较强, 但比较权威的确定权重的方法是运用TF-IDF公式, 即Wik=tfik/dfk=tfik×idfk, 其中tfik为特征项Tk在文档Di中的出现频率, 称为项频率 (term frequency) ;dfk则是文档集D中出现特征项Tk的文档的数量, 称为文档频率;idfk为dfk的倒数, 称为反转文档频率 (inverteddocument frequency) 。另外, 还应考虑到文档的长度, 否则长文档易被检出, 而短文档会被漏检, 所以通常还要对上面公式进行标准化处理。

假设有三个项:“经济”、“金融”和“计算机”, 它们在不同文档中的权值如表1所示。

根据这个表, 可以画出权值和文档的三维向量空间。

3. 计算向量之间的相似程度

相似度S (Similarity) :指两个文档内容相关程度的大小, 当文档以向量来表示时, 可以使用向量文档向量间的距离来衡量, 一般使用内积或夹角θ的余弦来计算, 两者夹角越小说明相似度越高。由于查询也可以在同一空间里表示为一个查询向量 (见图1) , 可以通过相似度计算公式计算出每个文档向量与查询向量的相似度, 排序这个结果后与设立的阈值进行比较。如果大于阈值则页面与查询相关, 保留该页面查询结果;如果小于则不相关, 过滤此页。这样就可以控制查询结果的数量, 加快查询速度。

三、以经济信息检索为例的实例分析

经济发展依赖于自然资源的开发与利用, 也离不开经济信息资源的开发和利用。开发经济信息资源, 实际上是对人类智力的开发, 是一种知识和科学技术的开发, 一种生产技能和管理技能的开发。现在, 经济信息已经渗透到现代生活的各个领域, 有效地地开发和利用经济信息, 提高经济信息的传播速度已经成为现代经济发展的一种推动力, 能够大大提高劳动者的智力水平, 从而促进经济的发展。因此, 在以经济建设为中心、大力发展社会主义经济的过程中, 必须不断地开发和利用经济信息资源。

经济信息是一种社会资源, 作用于经济活动过程, 已经成为现代社会经济发展的一个先决条件。现代经济建设是一个庞大而复杂的系统, 需要依据大量的经济信息去控制、指挥、协调和组织系统的内部关系, 系统和系统之间也需要靠经济信息去联系, 才能使经济活动达到人们预期的目标。在科学技术迅猛发展的社会里, 经济信息资源显得更加重要。

假设现有一个包含4篇经济金融类相关信息文档的集合, 这4篇文档如下:

D1:金融投资的对象是金融资产……

D2:金融资产是获得投资收益的资产……

D3:证券投资、基金投资和期权投资组成金融投资……

D4:获得投资收益是证券性金融投资的主要目的……

检索表达式Q为:金融投资的资产收益。

首先, 需要对文档和检索表达式进行分词处理, 其结果如下:

D1:金融/投资/的/对象/是/金融/资产/……

D2:金融/资产/是/获得/投资/收益/的/资产/……

D3:证券/投资/、/基金/投资/和/期权/投资/组成/金融/投资/……

D4:获得/投资/收益/是/证券/性/金融/投资/的/主要/目的/……

Q:金融/投资/的/资产/收益/。

然后除去停用词, 去除后的文档如下:

D1:金融/投资/对象/金融/资产/……

D2:金融/资产/获得/投资/收益/资产/……

D3:证券/投资/基金/投资/期权/投资/组成/金融/投资/……

D4:获得/投资/收益/证券/金融/投资/主要/目的/……

Q:金融/投资/资产/收益/。

计算项的权值根据公式

各个索引项的df和idf值如表2所示

各个索引项在文档中的频度如表3所示

则各个索引项在文档中的权值如表4所示

检索表达式的权值很简单, 如表5所示

采用内积法计算向量的相似度, 则可以看出, 文档D3与检索表达式的相似度最高, D1、D2、D4相同且低于D3。

四、算法分析总结

算法的计算复杂程度还需要进一步探讨, 目前这些研究都还不够深入, 许多问题还有待于进一步探讨;同时由于自然语言的复杂性, 新查询向量的查全率和查准率虽然有所提高向量模型是以假设向量空间的各维之间相互正交 (即各关键字之间相互独立) 为前提的, 因而不可避免地存在由此带来的损失关键字间的相关性的缺点, 可它把对文档内容和查询要求的处理简化为向量空间中向量的运算, 克服了布尔模型的二值评价的缺点, 可以计算出文档与查询式的相关程度, 因而可以很容易地进行输出结果的排序, 用户相关性反馈机制也很容易实现, 尤其是具有对处理海量数据的适应性等种种优点使得它自诞生以来, 至今都有很强的生命力。

参考文献

[1]雷景生林冬雪符浅浅:基于改进向量空间模型的Web信息检索技术研究[J].计算机工程, 2005, 1:14~16

[2]王晓黎王文杰:基于向量空间模型的文本检索系统[J].微电子学与计算机, 2006, 23:188~190

[3]包金龙:基于向量空间模型的信息检索系统的设计[J].情报检索, 2005, 7:44~45

[4]安茹娜:浅析经济文献信息的开发和利用[J].科技情报开发与经济, 2007, 12:54~55

[5]刘海峰王元元:基于向量模型的文本检索若干问题研究[J].情报杂志, 2006, 10:57~59

信息检索课程教学改革研究 篇7

关键词 信息检索 教学改革 主题案例法

分类号 G254.9

DOI 10.16810/j.cnki.1672-514X.2016.10.014

Research on Information Retrieval Course Reform:Design and Implementation of the Theme Case Teaching Method

Huang Yueshen

Abstract Aiming at the problems of the information retrieval course and the limitation of the existing case teaching method, this paper proposes the design of the theme case teaching method. This method takes the theme case as the main line to connect curriculum system, so as to guide students to establish a complete information retrieval thinking more effectively, and helps to realize the reform of the course from the teaching of information retrieval skills to the information retrieval thinking. In accordance with the theme case teaching method, it constructs the theme case library, and discusses 4 key factors including the structure, case design, content expansion, and the display of the theme case library.

Keywords Information retrieval. Curriculum reform. Theme case teaching method.

进入21世纪,我国高等教育改革进程加快,新的教育理念强调素质教育、自主学习能力和创新能力的培养。在此背景下,2002年2月,教育部颁布了《普通高等学校图书馆规程(修订)》,其中总则第三条明确规定当前高等学校图书馆五项主要任务之一就是“开展信息素质教育,培养读者的检索意识和获取、利用文献信息的能力。”[1] 这项规程赋予了信息检索课程新的时代任务,拉开了信息检索课程改革的大幕。关于教学方法的创新成为了课程改革的焦点和研究热点。

信息检索课程改革的核心是“教”与“学”两个方面,一是教师的“教育”需要转向检索思维的培育,具有启发性,二是学生的“学习”需要面向任务目标,具有实用性。教学改革不仅要求教与学双向而行,二者兼顾,同步创新,而且,实施方法须具有较强的可操作性。按照这个要求,本文针对当前信息检索课程中存在的普遍问题,提出了主题案例法的实施思路,分析了主题案例法相比于已有的案例教学法的优势,并深入探讨了主题案例库的构建策略。

1 信息检索课程存在的问题

当前,随着信息环境的巨大变迁、信息技术的飞速发展,信息检索课与信息环境、学生需求存在脱节现象,教学形势不容乐观。具体原因主要有4点。

1.1 教学目标特殊

一般课程的教学目标是帮助学生建立全新的知识体系,教学内容基本上是学生未知的知识,容易体现教学成效。相对而言,信息检索课并不是赋予学生全新的知识,而是在学生现有的知识基础上提高信息检索技能与策略,以帮助他们构建起系统化、个性化的检索思维。以此为目标,信息检索课的教学工作既不能落于俗套,缺乏启发性,又不能过于高冷,显得故弄玄虚,而是需要深入浅出,贴近实际。这要求教学设计与课程体系必须精益求精,能够给予学生新的启发和触动。看似简单的信息检索课,教学工作却并不轻松,这是课程不好上,上不好的深层原因。

1.2 教学内容平淡

目前,信息检索课多属于选修课,而且主要由图书馆老师兼任,他们白天上班,晚上上课,完成工作任务之余,还要应付课程任务。作为课程的主导者——教师们缺乏足够的时间、精力去深入地思考课程设计、创新教学方式,导致教学内容平淡,不仅没有达到教学目标,而且极易招致学生的抵触和反感。原被寄托培育学生信息素养厚望的信息检索课,沦为一门“鸡肋”课程。

1.3 教学设计乏味

信息检索是一门实用的课程,课程价值应体现为实用价值,教学设计应具有启发性。但是,在现实教学中却存在各种背离现象。如逐一讲解各种检索原理和方法相似的数据库,期望通过数据库的展示和理论的堆砌提升课程价值,但实际上对学生而言却是乏味的陈词,难以激发学习兴趣。

1.4 教学进程紧张

信息检索课不仅需要学生充分理解课堂知识点,而且还需要他们学以致用,这个过程不可能在课堂上全部完成,还需要学生课后反刍消化。但是,现在的信息检索课只注重课时内的教学,课时外的自学自省制度没有充分建立起来,致使学生忙于应付短平快的课堂学习,却疏于课后的自省学习。对学生而言,走马观花般的课堂学习不利于知识的内化,更勿论检索思维的培养和娴熟运用。

nlc202309081716

2 主题案例法实施思路

2.1 已有的案例教学法存在的问题和改进方向

2006年,华东理工大学唐永林老师首次提出将案例法引入到信息检索课程中,他认为应有针对性地引导学生运用基本信息检索理论和方法,对案例进行分析与讨论,深化对信息检索理论的理解[2]。此后,不少学者从激发学生学习兴趣的角度详细探讨了如何实施案例教学法[3-6]。虽然成果颇丰,但是,这些研究基本是在原有的课程体系中探讨案例法的实际运用和成效,只能作为对传统教学模式的改良。对此,早在2008年,学者杨光武在回顾信息检索课程的创新教学法时就深刻地指出,传统教学属于三段式教学:基础理论—理论应用—实训练习,现时的案例法只是在理论讲解时通过案例讲解强化学生的理解和记忆,是对传统教学的改良[7]。时至今日,这个问题仍未解决。2015年,常娥在《信息检索课案例教学法思考》中指出,当前的案例教学法圃于传统的信息检索教学理念的束缚,无论是检索案例的设计,还是检索案例的课堂教学,都与过去的上机实践课类似,未能发挥它在帮助学生构建立体检索思维方面的独特作用[8]。

针对当前案例教学法的症结,常娥进一步指出了案例教学法难于深入开展的原因为未形成完备的教学大纲和检索案例库,主要凭教师经验进行教学[9],并提出了解决问题的两个切入点。(1)重新认识案例教学法的地位与作用。应从课程设计的高度,考究以案例为中心的课程编排,用案例融汇知识、用案例联系实际、用案例启迪思维,而不是沿袭传统的课程编排方法,以检索理论和方法为核心,案例从属理论的老套路。(2)构建信息检索课主题案例库。多年来,案例教学法没能有效地深入推广的一个重要原因,是已有的实践研究主要是个人教学经验的总结,大家各说各的问题,没有在统一的框架内展开讨论,导致研究不能向纵深发展。因此,目前急需解决的问题是在总结现有教学经验的基础上,把教案体系、授课思路以主题案例库的形式固化,才能在此基础上进行更深入的探讨。

2.2 主题案例法的设计目标

与已有的案例教学法相比,主题案例法不仅是教学方法,而且是课程体系与学习体系的组织方法,它依托一系列的主题案例支撑起课程的体系结构,学生只要依次完成主题案例学习,就能系统地学习信息检索的全部流程与思维策略。

2.2.1 用案例统领知识

传统的信息检索课程以理论知识为主线串联课程,其弊端是过分强调理论的完备性,而忽视其实用价值,这是导致信息检索课问题百出的深层原因之一。例如,查准率与查全率这对评价检索结果的指标,理论上很完美,但实际上不符合当前的信息检索实务。在信息体量巨大的今天,要找全找准符合检索需求的信息是一件极难实现的事情,而且,通常情况下,检索者根本不需要这两项评价指标,只要能找到需要的信息解决问题即可。主题案例法的首要目标,就是把案例教学提升到课程体系的组织核心位置,以案例为中心融汇知识,从实用的角度重构知识体系,淘汰脱节的知识,留下适用的精华,拓展空缺的主题,永葆课程活力。

2.2.2 用案例启迪思维

传统的信息检索课程重在信息检索工具的利用和信息检索方法的讲解,其弊端是将信息检索局限在信息查找与获取阶段。然而,随着计算机与互联网技术的飞速发展,检索工具的普及度和易用性已有很大提升,再将信息检索课局限在工具讲解和技术分析上实无必要。信息检索课必须走出狭义的信息检索观,从广义的角度组织课程教学。信息检索是提出检索问题—分析检索问题—执行检索—分析整理检索结果—解决问题的过程。在此过程中,工具的使用只是其中一环,更重要的是检索者对问题的分析能力、对检索过程的掌控能力、对检索结果的利用能力,这要求今后的信息检索课必须强调对学生的检索意识和检索思维的培育和锻炼。

意识和思维的养成是一个主观的过程,修为看个人,外力仅起引导作用,绝不可能只通过知识灌输的方式来实现。为此,信息检索课应转变教学方式,重视案例教学的导向作用,针对学生在检索意识和检索思维方面的薄弱环节制定案例。例如,可以设计一些学生会遇到的问题包括如何读好大学?如何输入不会读音的生僻字?虽然这些题目表面上跟信息检索没有关联,但是实际上都可以通过信息检索来解决,而且用到的检索工具极为常用:利用图书馆的书目检索系统找“读大学”的指导书;使用百度搜索生僻字的字形结构就能获得解题线索。通过这些事例,就能让学生深刻地领悟到检索意识的重要性,即仅知道信息检索工具的使用方法并不等于能用好它们,还必须注重培养检索意识,在遇到实际问题时懂得灵活地使用检索工具。

3 主题案例库的构建方案

主题案例法是信息检索课程改革的支点之一,而主题案例库是主题案例法的具体实施方案。主题案例库不仅要发挥案例对理论知识的阐释作用,而且要通过组织主题案例体系串联起课程教学,有效引导学生的学习过程。主题案例库的建设重点不仅在于搜集精彩的个案为课程添姿润色,还在于建立起案例之间的主题关联,形成新的课程体系和学习体系,为教学工作提供新的思路和方向。

3.1 主题案例库的体系结构

传统的信息检索课程以传授检索技能为主,以资源和工具为组织体系,形成了特种文献检索、自科文献检索、社科文献检索、网络信息检索等课程内容。这种课程体系的优点在于对各类检索工具的使用技巧讲解深入,针对性强,但其弊端也显而易见,即在横向拓展检索技能的基础上,对检索过程的纵向构建不足,对学生构建检索思维的引导力不足。

针对传统检索课程体系的不足,现在的检索课程已将重点落在信息检索思维的培育与完善上,强调通过信息检索解决实际问题的能力。代表性课程包括:黄如花教授的《信息检索》MOOC课程[10],以信息检索在解决各类实际问题中的实施方法为线索组织课程内容,彻底颠覆了传统的信息检索课程体系;邓发云老师的国家精品课程教材《信息检索与利用》[11],在理论讲授的基础上,提供了大量的案例、思考训练题、讨论题,重在发挥案例讨论的启发式教学作用,是针对常规课程体系的有效改良;罗昭锋老师的《文献管理与信息分析》课程[12]的微课教学,将传统的课程内容转化为主题化的微课程,针对性、实用性强。业界关于信息检索课程体系的改良和变革,为主题案例库的组织设计提供了重要参考。

nlc202309081716

主题设计对整个主题案例法的实施起到关键的作用。按照信息检索课程的改革方向,应以信息检索思维在解决实际问题中的运用为教学目标。笔者认为,主题的设置必须围绕解决实际问题的需要,以解决问题为原点,依次设置分析检索问题—选择检索工具—构建检索策略(实施初次检索)—筛选检索结果—优化检索策略(实施多次检索)—利用检索结果六大主题,最后为解决问题提供有参考价值的信息结果。这个主题设计符合信息检索的一般流程,具有良好的通用性和实用性,容易学习。每个主题之间联系紧凑,既不冗余繁琐,又不缺乏内涵,主题的知识包容度高、拓展性强,可以根据信息环境和信息技术的发展,建立次级主题,从而保障课程的活力。

3.2 主题案例库的难点与对策

3.2.1 细化案例库的主题结构

主题是案例库的基础框架,主题结构细致深入,案例库才能丰满,课程内容才富有内涵和价值。反之,案例库只会徒有外表,给人故弄玄虚之感,结果适得其反。因此,在六大主题框架内,进一步细化主题结构是构建案例库的重要基础工作。表1列出了案例库的主题结构以及包含的知识点。

3.2.2 选择和分析主题案例

主题案例是案例库的核心要素,选择案例的标准以及分析案例的角度是制定案例时必须考虑的重要问题。首先,案例选择应满足两方面的条件,即普遍性和启发性。普遍性是指案例创设的情景应该是学生熟悉的,甚至是经历过的,这有利于学生理解和认同。启发性是指案例导向应该发人思考,引领学生从新的视角展开思考。其次,案例的分析角度应具有多元性,不仅要从检索技能的角度分析案例,更应该从检索意识、检索思维的角度剖析案例,这更能体现案例教学的优势。在制定案例时,还须注意精选案例,力求短小精悍。

按照上述原则,笔者针对“如何评估检索工具”主题,选用了百度作为案例对象,除了简要分析其原理、优点等学生熟悉的内容外,更重点分析它的局限性,这是学生容易忽视的地方。具体过程如下:通过使用百度检索“大数据”,对前20条结果进行分析,结果发现,百度知道、百度贴吧、百度文库、百度百科等百度旗下产品占据了10条之多。由此引导学生重新评价百度搜索引擎的客观性,并且思考如何避免“百度蒙蔽”现象,以及如何高效地搜索专题资源,让学生直观地意识到会用检索工具不代表能用好检索工具,还要进行科学评价、扬长避短、知贤善用。通过案例教学,引导学生发现自己在检索过程中的短板环节,进而思考应对措施,从而达到补强和完善检索思维的教学效果。

3.2.3 拓展新主题

永葆信息检索课程生命力的关键在于与时俱进。只有紧跟信息环境的变迁和信息技术的发展,切合当前主流趋势,不断拓展课程主题,才能继续扮演好引领者的角色,为学生带来超前的检索思维和先进的检索策略,才能满足学生对课程的期盼与要求。就课程特质而论,信息检索作为一门基于信息传播、信息技术与信息分析的工具课,与外部的信息大环境息息相关,外部变化需要及时地传递和反映到课程建设上。例如,针对当前网络流言猖獗、真假信息难辨的现象,笔者在“筛选检索结果”主题下拓展了二级主题“如何利用信息检索辨别网络信息的真伪”,通过选择和分析各类虚假信息的案例,引导学生建立起甄别虚假信息的5种思维方法,包括否定判断法、来源追踪法、逻辑分析法、人肉搜索法、存疑判伪法。又如,在大数据时代,需要强化对数据进行分析和利用的能力,为此,在“如何提取有价值的信息”的主题下建立“数据可视化分析”主题,讲授基础的数据分析流程和易用的可视化分析工具。

3.3 主题案例库的实现形式及功能拓展

为了适应在线学习的发展,主题案例库采用B/S架构实现,学生通过浏览器即可随时随地地进行课程学习。为了支持包括PC、平板电脑、手机等各种终端的访问需要,主题案例库采用两套页面布局方案,针对PC等大屏设备采用双列的框架式布局,针对手机等小屏设备采用单列的瀑布式布局。显示效果如图1、图2所示。

为了加强主题案例库的功能,可以采用“混搭”的方式,嵌入其他系统的优秀功能模块。例如,Moodle是一个功能成熟的在线学习平台,有丰富且成熟的课程互动功能,包括讨论、评论、提交作业等,只要进行适当的嵌入,就可以作为辅助功能融入到主题案例库中。在保持主题案例库已有组织形式的基础上,利用混搭方式嵌入第三方系统的优秀模块,扩展系统功能,使主题案例库更好地支持MOOC背景下的在线学习。

4 结语

在信息交流空前活跃、各种信息工具普及易用的信息环境下,信息检索观不可局限于获取信息的狭义观念中,必须从广义的层面认识信息检索,即以解决问题为目标的信息检索过程,课程内涵也必须随之从检索技能的传授扩展至检索思维的培育上。本文针对信息检索课存在的普遍问题,以及案例教学法在实施过程中存在的问题,提出了主题案例法的目标与思路,并深入探讨了主题案例库的实施方案。与已有的案例教学法相比,主题案例库的指导思路是以案例体系作为课程体系的组织框架。实施方法是以主题任务组织案例,以案例联结知识。以此为基础的学习过程能更有效地引导学生建立完整的信息检索思维。

参考文献:

[ 1 ] 张怀涛,慎明旭,岳修志,等.文献检索课的发展历程与发展对策[J].大学图书馆学报,2011(3):81-84.

[ 2 ] 唐永林,唐梦斐.文献检索课程的“案例教学法”初探[J].现代情报,2006(3):199-201.

[ 3 ] 罗敏.案例教学在文献检索课程中的应用探讨[J].大学图书馆学报,2007(3):101-103.

[ 4 ] 黄碧云,胡德华,罗爱静,等.信息检索精品课程中应用案例教学法研究[J].图书馆学研究,2007(1):58-60.

[ 5 ] 王敏,嵇绍春.案例教学法在文献检索课程教学中的应用[J].图书馆理论与实践,2013(1):101-102.

[ 6 ] 马建春.案例教学法在信息检索课教学中的应用探讨[J].图书馆研究,2011,41(1):120-122.

[ 7 ] 杨光武.项目课程法在文献检索课教学中的应用[J]. 大学图书馆学报,2008(4):81-84.

[ 8 ] 常娥.信息检索课案例教学法思考[J].图书情报工作,2015(8):54-58.

[10] 黄如花.信息检索[EB/OL].[2015-12-02].http://www.icourse163.org/course/whu-29001#/info.

[11] 邓发云.信息检索与利用[M].北京:科学出版社,2013.

[12] 罗昭锋.文献管理与信息分析[EB/OL].[2015-12-02]. http://mooc.chaoxing.com/course/874584.html.

上一篇:春节八年级作文400字下一篇:学分制导师工作总结