您的位置: turnitin查重官网> 图书馆 >> 情报计量 >信息学论专利信息学学术

信息学论专利信息学学术

收藏本文 2024-04-05 点赞:5293 浏览:19207 作者:网友投稿原创标记本站原创

〔摘 要〕专利信息学是在全球经济化浪潮之下的一个新兴的研究领域。专利信息学的物质基础是专利信息源,包括专利文件、专利数据库及专利相关网站,由专利用户的多样性而形成的各种专利信息需求是专利信息学研究的对象,专利信息学的研究工具是专利软件系统,专利信息学的未来是专利信息的智能化。
〔关键词〕专利信息学;专利信息源;专利信息需求;专利软件系统;专利智能
〔〕A 〔文章编号〕1008-0821(2012)10-0032-07
计算机和网络等信息技术的进步,对当今社会发展产生了深刻影响。自然科学与信息学的融合,大大拓展了人们的认知和研究领域,生命科学与信息技术的碰撞,产生了生物信息学,化学与信息技术的碰撞,产生了化学信息学。随着以专利为核心的知识产权在科技创新和经济社会发展中的作用日益显著,Vertex制药公司高级研究员安东尼·特里普(Anthony J.Trippe)在Searcher上发表了“专利信息学:从无到有的寻觅”(Pafinformation:Identifying Haystacks from Space),定义了由专利与信息学交融组合而产生的“专利信息学”(Patinformation)的概念。专利信息学就是以计算机技术处理专利数据为政府和产业挖掘新技术的方向和趋势,为决策者提供信息支撑。

1 专利信息源

专利信息源由专利文件、专利数据库和专利相关网站组成。

1.1 专利文件

1.1 专利文件信息披露的不同阶段

随着不同的专利生命周期的变化,专利文件所反映的特征是不同的,其信息披露也是不一样的(表1)。

1.2 专利文件技术信息的惟一性

专利文件所传递的技术信息有可能是惟一的,在非专利文献中未报到的美国专利及商标局(USPTO)在“Eighth Technology Assesent and Forecast Report.Section II:The uniqueness of patents as a technological resource”中明确指出,10件美国专利中有8件专利文件中所含有的技术信息在非专利文献中未见披露。同时专利文件中的信息比学术论文中的信息要详尽,全面。这主要是因为像WIPO 这样的国际标准要求专利文件必须有完整的元数据披露。一份标准的专利文件包括扉页、背景描述、权利要求及附图,如果可能的话,附上国际检索报告。

1.3 专利文件的撰写特色

专利文件显现出一定的特色,显著地长于原始的论文;不同的部分有着特定的写作风格;常常含有一些多媒体数据、数学公式和化学结构式。这些特征在应用自动信息处理技术进行整序时必须考虑以特殊的分析及分类算法进行处理。专利文件提供了标准元数据:专利名称,专利申请、公开和授权的日期及序号,申请人及发明人,专利分类。

1.4 专利分类法

国际专利分类法是一种国际统一化、标准化的专利分类方法。由于其具有完整性、科学性、适用性的特点,现在几乎被世界上所有建立专利制度的国家采用。中国自1985年4月1日实行专利制度以来就采用了这种分类方法。
为了促进欧洲在科学技术上的密切合作和协调,1951年,欧洲理事会专利专家委员会决定成立专利分类法的专门工作组,并开始进行国际专利分类表的编制。经过3年的研究,1954年12月,英、法、德、意大利等15个欧洲国家在巴黎签订了《关于发明专利国际分类法欧洲协定》,并作为协定的附件,产生了一份《国际专利分类表》(European Convention on the International Classification of Patents Invention),该分类法和分类表(包括其分类号)均被缩写成IPC(International Patents Classification)。该分类表由上述专利专家委员会修订后,于1968年2月通过,并于1968年9月1日起公布生效。该分类表为第一版的《国际专利分类表》。

1.2 专利数据库

专利文件被组织,形成从内容到检索方法都大有差别的专利数据库。内容以空间、时间和提供文件的完整性(全文或文摘)为特征;检索方法从Boolean searches到advanced retrieval approaches。此外数据库提供的文件的完整性,文件格式都是质量评判的因素。一般来说,较老一些的专利文件的格式为图像(电子扫描过程中不带有OCR);现代的专利文件都是电子格式,可以自动OCR启动,具有纠错功能。近年来的一些专利文件以XML格式处理。
专利数据库有免费数据库和商业数据库,前者如各个国家、地区的知识产权组织的数据库,像the European Patent Office(EPO),the United States Patent and Trademark Office3(USPTO)and The World Intellectual Property Organization(WIPO)。后者为一些需购写的授权数据库,典型的有The World Patent Index,Derwent Innovition Index等。无论哪一类型的数据库,其数据都存在着错误,有O

源于:毕业设计论文网www.udooo.com

CR识别错误,有元数据错误,最典型的是远东语种与西方语种的翻译错误(申请人和发明者的姓名翻译错误)。这些错误给检索带来了困难,因此数据库中必须配有合适的纠错功能软件。
基本的核心专利信息通常不足以满足专利信息用户的需求。所以将其它来源的信息与专利信息进行整合形成的数据库也是极有意义的。例如,专利法律状态数据库,整合了某件专利的历史数据;再如,研究论文数据库,储存了某件专利的参考背景知识。

1.3 专利相关网站

此外,专利论坛和博客交流着即时的专利互动信息,包括一般用户和专业用户,企业门户网站也报道着专利的专题报告和专题新闻。Web 2.0 mash-ups使得整合的过程更加简单有效。在此值得一提的是美国的Peer-To-Patent项目。2007年,纽约法学院(New YorkLaw School,NYLS)与USPTO联合推出了一个名为“公众专利评审”的网上试验平台,为:www.peertopatent.org。该平台首次允许公众在一定程度上参与到专利审查过程中来,其主要宗旨在于通过网络连接USPTO和公众(特别是其中的科学技术人员)以提高专利质量。

2 专利信息需求

不同的专利信息用户,根据不同的供职领域,其信息需求也不尽相同。申请人和发明者的需求在于检索先进技术,查证手中的发明的新颖性,从而提出一件新的专利申请;同时他们还有着发现其拥有的授权专利的被侵权信息。研究人员的需求在于查询专利信息,以避免重复研究和免费使用失效专利技术。管理人员的信息需求在于开发专利信息资源,发现竞争者、合作者和技术提供者,确证技术发展趋势,挖掘新的商机。风险资本投资人员通过专利信息查询,利用杠杆效应选择其金融操作的目标。第三方相似度检测通过获取专利信息选择技术卖家。
专利信息的用户对专利信息的需求归纳起来主要包括以下几个部分。
(1)整合的专利信息资源
将尽量完备的各国专利信息资源整合在一个数据库中供用户使用。包括各主要国家的专利信息,以及同族专利信息、法律状态信息、专利权转让与受让信息、专利许可信息复审/诉讼与无效信息对比文献信息,对专利文献的技术评估信息等。
(2)专利信息的翻译
语言障碍是终端用户对国外专利信息利用不够的一个主要原因通过提供专利信息的在线翻译能提高我国用户对国外专利信息的使用。从全球的视角出发,尤其是在中韩等亚洲发展中国家出现的前所未有的专利申请量的飙升,就对跨语言查询和自动翻译提出了越来越高的要求。
(3)专利分析
终端用户迫切需求能够对专利信息进行分析,对专利信息的分析包括技术分析,竞争力分析,权利分析,引文分析组合分析,聚类分析,重点技术领域的产业发展现状及前景分析等。
一般来说专利信息用户的专利信息需求有3个方面:专利检索、专利分析和专利监控。

2.1 专利检索

表3列举了各项专利任务的应用,解决的问题,最终的结果。专利性检索、专利有效性检索和专利侵权检索构成了专利尽职检索,这一部分检索任务只局限于特定的技术领域。而技术方案及投资方案的决策性检索是商业策划和战略投资的重要组成部分,这样的检索任务在广泛的视野中进行。

2.2 专利分析

专利分析按照不同的应用可以有不同的分类,可以分为宏观分析和微观分析(表4),也可以分为商业需求分析(如知识产权评价)和技术分析。知识产权评价通过开发专利数据,像专利族的规模,引文量,进行专利评估[4-5]。专利地图是技术分析的一种有效工具,专利地图可以用于考察新技术的介入和退出情况,判断研发机构的技术发展动向;它与地形图结合,可以直观地展示技术主题分布情况和技术热点演进;专利地图与技术路线图整合,可用于进一步了解技术的未来发展;专利地图与市场信息搭配,逐渐成为监控企业研发与产品布局的先前指标;专利地图也可以用于分析国家与国家之前的产业竞争态势,或是一国产业发展的研发实力[6-7]。

3.2 专利软件的发展方向

3.

2.1 高级检索

支持相似文件和相似图形的高级检索,一方面使得检索生手能从检索提问中获得较高匹配度的结果;另一方面减少专业检索用户的搜索时间。通常应用自然语言处理技术,文本检索技术,多媒体技术和语义网实现。
网络信息系统的检索功能一般都带有相似检索选项,使用户在检索初始词的同时看到近似词,并可以选用近似词帮助扩大查询范围。这项功能可以大大增加检索的查全率,帮助用户找到自己最想要的资源。但是在专利检索方面,如中国国家知识产权局专利检索与怎么写作系统和中国知识产权网专利信息怎么写作平台,都没有提供相似专利检索的功能。
3.

2.2 探索性检索

对于无法直接找到答案的信息需求的搜索,都可以称之为探索性检索exploratory search。实际中存在着大量的这样的需求,每个人都有这样的需求。例如,对专利主题的关注;对某个主题专利感兴趣,想要持续地了解这个主题的情况等等。这样的信息需求都不是通过通用搜索引擎能够解决的。
(1)探索性检索的特性
①相关信息搜集
当用户需要了解一个主题专利的时候,这个主题往往包括很多方面的信息。系统应该能够将这个主题相关的信息分门别类、持续地提供给用户。这里面的一个核心问题应该是信息相关性分析问题,即:一条专利信息是否跟该主题有密切的关系?是在哪方面的关系?等。
②协同工作
当然用户可以独立工作。但是,如果一群对某个特定主题都感兴趣的人能够在一起互相配合,共同学习、理解、发现,相信对每个人来说都是有帮助的。因此,这个怎么写作应该是一个能支持具有相关兴趣的人协同获取信息,协同工作。

当用户开始关注某个主题专利的时候,一定会看到一些相关信息。系统应该支持用户将这些专利信息搜藏起来,在需要的时候能够随时看到。
④特殊的数据挖掘能力
对于一些能够统计的信息,根据需要,系统可以增加一定的数据挖掘怎么写作。如:对某类主题专利的数量统计以及随时间变化。
(2)相关性分析
专利探索性检索中的核心问题是相关性分析,也就是说一件专利或一条信息和另一件专利或另一条信息的相关程度。怎么来衡量?传统的信息相关度方法,如:用文本向量的夹角来衡量两个文本之间的相关度,只能找出与一篇文章类似的文章。但是相关的文章却并不一定是内容很类似的文章。这儿可以借鉴半监督(semi-supervised)的方法来支持用户从不同的角度看同一件专利。
(3)专利探索性检索的技术
专利探索性检索通常使用结构化的分面检索和异构化的专

摘自:学生论文www.udooo.com

利聚类检索实现,从而提高专利检索的查全率和查准率。结构化的分面检索有从专利的一些著录项目入手,如专利号、专利权人、专利公开日期等;异构化的专利聚类检索主要运用聚类分析的方法,结合文本空间向量、信息可视化技术等进行检索。此外还可以通过对互联网等信息的整合,从经济学的角度对专利技术提供评估和决策。3.

2.3 跨语言和自动翻译

跨语言信息检索(Cross-Language Information Retrieval,CLIR)是使用某一种语言来查询另外一种语言的文件,不过由于语言上的差异,通常都需要将查询Query)转换成跟文件一样的语言。目前大多数的使用者会在因特网上使用搜寻引擎来查询所需要的资料,当我们输入中文的查询字,执行检索后我们可以发现结果可以包含其它语系与Query有关的相关信息,这就是因为搜寻引擎会自动将您的输入的Query翻译成其它的语系并执行检索的动作,由此可知跨语言的信息检索可以让使用者方便使用自己熟悉的语言来检索其它语系的文件。在跨语言信息检索相关的研究中,大部分采用的方法可归纳成文件翻译(Document Translation)和查询翻译(Query Translation)两种,两种技术的目标都是要将查询和文件的语言转为一致。使用文件翻译的检索方式必须将所有文件都翻译和Query相同的语系,优点是文件与查询都是使用相同的语言,使用者可以直接阅读,缺点是翻译所有的文件必须耗费大量的时间。查询翻译需先将Query翻译成和文件相同的语言,目前在跨语言信息检索中被广泛的使用,此方法的好坏取决于Query是否被正确翻译,而翻译的方法有几种被提出;有字典翻译Dictionary-based translation)方法,语料库翻译(Corpus-based translation)方法,混和(Hybrid)方法,网络翻译撷取(web-based translation extraction)方法;由于因特网上的资源众多,很多的专家学者利用此优势,使用网络查询后再使用机率统计其结果,最后选择最佳的翻译当结果,使用网络撷取翻译方式可以降低词汇涵盖度的问题。
综观以上方法,主要的目标都是将查询和文件转化成相同的语言,再进行信息检索,查询的文字中某些关键词词若无法被正确地翻译,将会影响跨语信息检索的准确性。在跨语言信息检索中,大部分的亚洲语言并不像英文一样在每个单词间都有分隔符号,因此断词这个步骤就显得格外的重要,针对亚洲语系的断词使用不同方法,在处理日文断词方法采用bi-gram加上uni-gram可得到更好的效用[12]。
欧洲的CLEF和日本的NTCIR研讨会是进行跨语言信息检索评估的两大主要平台,其中NTCIR将跨语言专利信息检索作为一个重要的测试任务。世界知识产权组织(wipo)的PATENTSCOPE也开发了跨语言检索和机器翻译功能。
中国国家知识产权局专利检索与怎么写作系统不仅在资源、功能方面具有明显优势,使用起来也方便快捷。如检索功能中的“跨语言检索”,用户可用一种提问语言检索出用另一种语言书写的信息。只要用户在特定字段中输入中文或英文两种语言中的一种,选择进行“跨语言检索”,系统就能够自动命中匹配输入条件语言的相关专利文献,提高检索效率。今后还会有更多的语言种类加入此项功能,目前日语跨语言检索功

摘自:写毕业论文经典的网站www.udooo.com

能正在构建当中。
富士通研究开发中心有限公司研究开发了云之间的应用程序集成技术。通过协同日本与中国的云网关技术,融合现有的统计机器翻译技术,实现了面向中国用户的跨语言专利检索系统。实现了对位于日本馆林IDC的日文专利检索怎么写作和位于苏州IDC的中日机器翻译怎么写作的有效集成。该跨域语言专利检索系统目前已经上线风云网络的SaaS中心,并开始向中国客户提供试用怎么写作。
图1 跨语言专利检索(中-日版)效果图

4 结 论

专利信息在全球的经济发展起着关键的作用,各种数据库和软件工具在很长一段时间中支撑着专利信息的应用和传播。专利信息学在此大背景之下应运而生,吸引着越来越多的注意力,面临着许多需要解决的课题,如:日益增加的多语种的专利申请量;有着从自然科学到社会科学不同的专业背景和知识结构的专利信息用户的多样性,包括技术人员,管理者、投资者等等;从防御性的知识产权研究到利用专利信息源挖掘新的技术空白点及商机。
专利信息学是一个新兴的研究领域,专利信息源是构成专利信息学的物质基础,专利信息需求是专利信息学的实践对象,专利软件系统是专利信息学的研究工具。专利信息学的未来是挖掘隐藏的知识及其关联,通过语义网提供完备的专利信息检索,完善专利分析及评估,实现专利信息的智能化。
参考文献
贾丹明.我国专利信息用户的需求分析[J].中国发明与专利,2010,(9):68-69.
Dario B et.al.Review of the state-of-the-art in patent information and forthcoming evolutions in intelligent patent informatics[J].World Patent Information,2010,32:30-38.
[3]Wanner L,Baeza-Yates R,Brügmann S,Codina J,Diallo B,Escorsa E,et al.Towards content-oriented patent document processing[J].World Patent Inform,2008,30(1):21-33.
[4]李振亚.基于四要素的专利价值评估方法研究[J].情报杂志,2010,29(8):87-90.
[5]张彦巧.企业专利价值量化评估模型实证研究[J].情报杂志,2010,29(2):51-54.
[6]鲍志彦.基于专利地图的竞争情报挖掘及实证研究[J].情报杂志,2011,30(9):12.
[7]殷媛媛.专利地图图形学及解读方法研究[J].图书情报工作,2010,(S2):363-367.
[8]Hunt D,Nguyen L,Rodgers M.Patent searching:tools and techniques[M].John Wiley and Sons,2007:251.
[9]Porter A,Cunningham S.Tech mining:exploiting new technologies forcompetitive advantage[M].John Wiley and Sons,2005:142.
[10]Iwayama M,Furujii A,Kando N.Overview of classification subtask at NTCIR-5patent retrieval task[C].∥NTCIR-5 workshop meeting,2005:15.
[11]王根.基于地方知识产权战略的专利情报分析软件研究——以东莞市为例[J].情报科学,2011,29(9):1435-1440.
[12]邓舜元.结合线上翻译怎么写作的跨语言专利检索系统[EB/OL].www.aclweb.org/anthology/O/O08/O08-2009.pdf 2010-2-20,2012-04-15.
(本文责任编辑:孙国雷)

copyright 2003-2024 Copyright©2020 Powered by 网络信息技术有限公司 备案号: 粤2017400971号