HOME 首頁
SERVICE 服務(wù)產(chǎn)品
XINMEITI 新媒體代運營
CASE 服務(wù)案例
NEWS 熱點資訊
ABOUT 關(guān)于我們
CONTACT 聯(lián)系我們
創(chuàng)意嶺
讓品牌有溫度、有情感
專注品牌策劃15年

    信息檢索關(guān)鍵詞提取方法(信息檢索關(guān)鍵詞提取方法是什么)

    發(fā)布時間:2023-04-14 13:41:42     稿源: 創(chuàng)意嶺    閱讀: 125        

    大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于信息檢索關(guān)鍵詞提取方法的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。

    開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等

    只需要輸入關(guān)鍵詞,就能返回你想要的內(nèi)容,越精準,寫出的就越詳細,有微信小程序端、在線網(wǎng)頁版、PC客戶端

    官網(wǎng):https://ai.de1919.com。

    創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,如需了解SEO相關(guān)業(yè)務(wù)請撥打電話175-8598-2043,或添加微信:1454722008

    本文目錄:

    信息檢索關(guān)鍵詞提取方法(信息檢索關(guān)鍵詞提取方法是什么)

    一、怎么在一堆圖片中抓取關(guān)鍵詞

    可以用抽取方法。

    有監(jiān)督無監(jiān)督抽取方法:無監(jiān)督關(guān)鍵詞提取方法主要有三類:基于統(tǒng)計特征的關(guān)鍵詞提?。═F,TF-IDF);基于詞圖模型的關(guān)鍵詞提取(PageRank,TextRank);基于主題模型的關(guān)鍵詞提取(LDA)基于統(tǒng)計特征的關(guān)鍵詞提取算法的思想是利用文檔中詞語的統(tǒng)計信息抽取文檔的關(guān)鍵詞;基于詞圖模型的關(guān)鍵詞提取首先要構(gòu)建文檔的語言網(wǎng)絡(luò)圖,然后對語言進行網(wǎng)絡(luò)圖分析,在這個圖上尋找具有重要作用的詞或者短語,這些短語就是文檔的關(guān)鍵詞;基于主題關(guān)鍵詞提取算法主要利用的是主題模型中關(guān)于主題分布的性質(zhì)進行關(guān)鍵詞提??;

    將關(guān)鍵詞抽取過程視為二分類問題,先提取出候選詞,然后對于每個候選詞劃定標簽,要么是關(guān)鍵詞,要么不是關(guān)鍵詞,然后訓(xùn)練關(guān)鍵詞抽取分類器。當新來一篇文檔時,提取出所有的候選詞,然后利用訓(xùn)練好的關(guān)鍵詞提取分類器,對各個候選詞進行分類,最終將標簽為關(guān)鍵詞的候選詞作為關(guān)鍵詞。

    二、文獻信息檢索的方法和途徑

        文獻信息檢索的方法方式有好多 , 以下是我為大家整理的關(guān)于文獻信息檢索的方法和途徑,歡迎閱讀!

    文獻信息檢索的方法和途徑

    文獻檢索步驟:文獻檢索是一項實踐性很強的活動,它要求我們善于思考,并通過經(jīng)常性的實踐,逐步掌握文獻檢索的規(guī)律,從而迅速、準確地獲得所需文獻。一般來說,文獻檢索可分為以下步驟:

    (1)明確查找目的與要求。

    (2)選擇檢索工具

    (3)確定檢索途徑和方法

    (4)根據(jù)文獻線索,查閱原始文獻

    文獻檢索方法

    (1)、直接法

    又稱常用法,是指直接利用檢索系統(tǒng)(工具)檢索文獻信息的方法。它又分為順查法、倒查法和抽查法。

    (1)順查法

    順查法是指按照時間的順序,由遠及近地利用檢索系統(tǒng)進行文獻信息檢索的方法。這種方法能收集到某一課題的系統(tǒng)文獻,它適用于較大課題的文獻檢索。例如,已知某課題的起始年代,現(xiàn)在需要了解其發(fā)展的全過程,就可以用順查法從最初的年代開始,逐漸向近期查找。

    (2)倒查法

    倒查法是由近及遠,從新到舊,逆著時間的順序利用檢索工具進行文獻檢索的方法。此法的重點是放在近期文獻上。使用這種方法可以最快地獲得最新資料。

    (3)抽查法

    抽查法是指針對項目的特點,選擇有關(guān)該項目的文獻信息最可能出現(xiàn)或最多出現(xiàn)的時間段,利用檢索工具進行重點檢索的方法。

    (2)、追溯法

    是指不利用一般的檢索系統(tǒng),而是利用文獻后面所列的參考文獻,逐一追查原文(被引用文獻),然后再從這些原文后所列的參考文獻目錄逐一擴大文獻信息范圍,一環(huán)扣一環(huán)地追查下去的方法。它可以像滾雪球一樣,依據(jù)文獻間的引用關(guān)系,獲得更好的檢索結(jié)果。

    (3)、循環(huán)法

    又稱分段法或綜合法。它是分期分交替使用直接法和追溯法,以期取長補短,相互配合,獲得更好的檢索結(jié)果。

    文獻的檢查途徑

    簡單地說,就是查找文獻的方法。常用查找文獻的方法有檢索工具法、引文追蹤法、綜合法和瀏覽法。

    1.1檢索工具法

    檢索工具法是指直接利用檢索工具(系統(tǒng))檢索文獻信息的方法,這是文獻檢索中最常用的一種方法。它又分為順查法、倒查法和抽查法。

    1)順查法:是指按照時間的順序,由遠及近地利用檢索系統(tǒng)進行文獻信息檢索的方法。這種方法能收集到某一課題的系統(tǒng)文獻,它適用于較大課題的文獻檢索。例如,已知某課題的起始年代,現(xiàn)在需要了解其發(fā)展的全過程,就可以用順查法從最初的年代開始,逐漸向近期查找。

    2)倒查法:是指由近及遠,從新到舊,逆著時間的順序利用檢索工具進行文獻檢索的方法。此法多用于查找新課題或有新內(nèi)容的老課題,在基本上獲得所需信息時即可終止檢索,因而它更多地關(guān)注于最近一個時期內(nèi)的較新文獻,可保證文獻信息的新穎性,并且也可提高檢索的效率。但由于這種方法不太關(guān)注歷史淵源和全面系統(tǒng)性,易于產(chǎn)生高漏檢率,影響檢索的全面性。

    3)抽查法:是指針對學科特點,抓住該學科發(fā)展迅速、文獻發(fā)表較多的一段時間逐年檢索的方法。當學科處于興旺發(fā)展時期,其研究成果和發(fā)表的文獻一般也較多。這種方法針對性強,省事省力,效率高。但必須是在熟悉學科發(fā)展階段的基礎(chǔ)上才能使用,否則要影響檢所的全面性和準確性。

    1.2 引文追蹤法

    也稱參考文獻查找法、跟蹤法、追溯法等,它是以一篇現(xiàn)有文獻(特別是專著和綜述)為依據(jù),以其文后所附參考文獻為線索,進一步追蹤、查找相關(guān)文獻。這是—種擴大信息來源最簡單的方法,在沒有檢索工具或檢索工具不完整時刻借助此法獲得相關(guān)文獻。這種方法的優(yōu)點在于文獻涉及范圍比較集中,針對性強,往往會找出有關(guān)研究領(lǐng)域中重要的、豐富的原始資料,而且獲取文獻資料也方便迅速,并可不斷擴大檢索的范圍和線索。但由于受文獻資料原作者引用資料的局限性及主觀隨意性等因素的影響,不僅容易出現(xiàn)漏檢現(xiàn)象,而且檢索的資料也往往比較雜亂,缺乏可靠性和時序性。

    1.3 綜合法

    又稱為循環(huán)法,它是把上述兩種方法加以綜合運用的方法。綜合法既要利用檢索工具進行常規(guī)檢索,又要利用文獻后所附參考文獻進行追溯檢索,分期分段地交替使用這兩種方法。即先利用檢索工具(系統(tǒng))檢到一批文獻,再以這些文獻末尾的參考目錄為線索進行查找,如此循環(huán)進行,直到滿足要求時為止。

    綜合法兼有檢索工具法和引文追蹤法的優(yōu)點,可以查得較為全面而準確的文獻,是實際中采用較多的方法。對于查新工作中的文獻檢索,可以根據(jù)查新項目的性質(zhì)和檢索要求將上述檢索方法融匯在一起,靈活處理。

    1.4 瀏覽法

    瀏覽法是指研究人員平時對與本專業(yè)或本學科相關(guān)的原始文獻資料進行瀏覽、閱讀和積累的一種方法。由于檢索工具與原始文獻之間一般有6個月左右的時間差,為了彌補這些缺陷,就需要研究人員及時閱讀最新生產(chǎn)的原始文獻,不斷積累相關(guān)資料,跟蹤學科發(fā)展的前沿。

    文獻檢索的方法多種多樣,究竟采用哪種方法更合適,需要根據(jù)學科的特點、檢索的要求和檢索的條件來確定,一般以檢索工具法為主,其他方法作為補充。

    2.文獻檢索途徑

    文獻檢索途徑即檢索工具、檢索系統(tǒng)提供給用戶用于檢索所需文獻的檢索入口。為了適應(yīng)用戶多樣化的需求特點,基于文獻的某些特征,檢索工具(檢索系統(tǒng))往往制作各種索引,設(shè)置各種各樣的檢索途徑,如主題途徑、題名途徑、關(guān)鍵詞途徑、摘要途徑、關(guān)鍵詞途徑、分類途徑、著者途徑等。

    1) 主題途徑

    主題途徑是指通過文獻資料的內(nèi)容主題進行檢索的途徑,它依據(jù)的是各種主題索引或關(guān)鍵詞索引,檢索者只要根據(jù)項目確定檢索詞(主題詞或關(guān)鍵詞),便可以實施檢索。

    主題途徑檢索文獻關(guān)鍵在于分析項目、提煉主題概念,運用詞語來表達主題概念。主題途徑是一種主要的檢索途徑。

    2)題名途徑

    題名途徑是以書名、刊名、篇名等文獻名稱作檢索標識來查找文獻的途徑。

    3)著者途徑

    著者途徑是指根據(jù)已知文獻著者來查找文獻的途徑,它依據(jù)的是著者索引,包括個人著者索引和機關(guān)團體索引。

    4)分類途徑

    分類途徑是從文獻所屬學科類目來檢索的途徑,它所依據(jù)的是檢索工具中的分類索引。

    分類途徑檢索文獻關(guān)鍵在于正確理解檢索工具的分類表,將待查項目劃分到相應(yīng)的類目中去。

    5)其他途徑

    其他途徑包括利用檢索工具的各種專用索引來檢索的途徑。專用索引的種類很多,常見的有各種號碼索引(如專利號、入藏號、報告號等),專用符號代碼索引(如元素符號、分子式、結(jié)構(gòu)式等),專用名詞術(shù)語索引(如地名、機構(gòu)名、商品名、生物屬名等)。

    3.文獻檢索步驟

    文獻檢索步驟與檢索的具體要求密切相關(guān),科技文獻檢索中最常見的檢索要求是查找有關(guān)某一課題的針對性文獻,大致可分為以下幾個步驟。

    3.1 分析檢索課題,明確檢索要求

    1)分析主題內(nèi)容,確定檢索主題詞

    對檢索課題進行深入的主題分析,明確所需文獻的具體內(nèi)容、性質(zhì)和特點,并形成檢索的主題概念,力求檢索的主題概念能準確地反映檢索要求,并找出與之有關(guān)的所有主題詞。

    舉例:如檢索“土壤環(huán)境條件對豆科植物固氮作用的影響”的文獻,若僅從課題題目的“土壤環(huán)境”、“豆科植物”、“固氮作用”做主題詞是很不夠的,應(yīng)對課題做更深入細致的主題概念分析,選擇一些與主題內(nèi)容關(guān)系密切的詞語一起作為主題詞,如決定土壤環(huán)境條件的溫度、濕度和PH值,豆科植物中的大豆、花生等,以及在固氮作用中起重要作用的固氮菌、根瘤菌等,這樣就能更充分地揭示課題基本內(nèi)容,查獲文獻的可能性就會大大提高。

    2)據(jù)檢索的主題概念,確定課題涉及的學科范圍

    當課題涉及多學科時,以主要學科為檢索重點,次要學科為補充,以全面系統(tǒng)地檢得所需文獻。

    3)分析文獻類型-提高檢索的針對性

    若進行基礎(chǔ)理論研究,側(cè)重于期刊、圖書和學位論文;搞技術(shù)創(chuàng)新,側(cè)重于專利文獻;做定型產(chǎn)品設(shè)計,側(cè)重于標準文獻;探討科學的最新發(fā)展及動向研究,側(cè)重于科技報告和會議文獻。

    4)分析查找年代

    根據(jù)課題的歷史背景和檢索要求,確定檢索的最有可能、最為適宜的時間范圍。如申請專利的查新檢索,回溯年限要長,而了解課題的研究水平與動向等,回溯時間可短。

    5)分析地區(qū)范圍:以便針對性選擇檢索的語種、國別和地區(qū)

    如檢索“茶葉加工技術(shù)”的文獻,應(yīng)以中文、日文為主要語種,主要在中國、日本及東南亞一些有飲茶習慣的國家和地區(qū)的文獻中查找;而檢索“生物技術(shù)”的文獻,應(yīng)以英文為主要語種,主要在美國等西方發(fā)達國家的文獻中查找。

    3.2 選擇檢索工具,確定檢索方式

    由于用于檢索數(shù)字資源的數(shù)據(jù)庫種類很多,各數(shù)據(jù)庫的內(nèi)容也有很大差別,正確選用合適的數(shù)據(jù)庫就顯得非常重要。選擇數(shù)據(jù)庫之前應(yīng)弄清課題明確的檢索要求,所需要的主要文獻類型等事項。

    許多數(shù)據(jù)庫提供多種檢索方式,如《中國期刊全文數(shù)據(jù)庫》提供了初級檢索、高級檢索、專業(yè)檢索和分類檢索等途徑,搜索引擎如百度等提供簡單檢索與高級檢索界面。初級檢索雖然簡單明確、易學易用,但檢索速度、查準率和查全率都低于命令檢索。而專業(yè)檢索可以綜合應(yīng)用各種檢索運算符或操作命令精確地表達檢索需求,靈活地進行各種檢索方案的檢索,較為簡捷、快速地得到較為理想的檢索效果,但是需要用戶熟悉各種系統(tǒng)的檢索操作符,適合于有經(jīng)驗的檢索人員。因此高級檢索方式更適合一般用戶,其界面操作簡單,對用戶的檢索技能要求不高,而且檢索功能設(shè)置較為充分和靈活,基本上能滿足用戶的檢索需求。

    3.3 選擇檢索途徑,確定檢索策略式

    數(shù)據(jù)庫都會根據(jù)文獻的內(nèi)容特征和外部特征提供多種檢索途徑,除主要利用主題途徑、篇名途徑、摘要途徑和關(guān)鍵詞途徑外,還應(yīng)充分利用分類途徑、著者途徑等多方位進行補充檢索,以避免單一種途徑不足所造成的漏檢。

    檢索策略式是通過檢索界面的構(gòu)造來表達用戶檢索提問的邏輯表達式。一般一個課題需用多個檢索詞表達,并且將這些檢索詞用一定的方法確定關(guān)系,以完整表達一個統(tǒng)一的檢索要求。在編制檢索提問式時,準確、合理地運用位置邏輯算符、截詞符、字段符等技術(shù)是編制檢索式的基本要求。

    3.4 查找相關(guān)文獻,修正檢索策略式

    實施檢索后,獲得的檢索結(jié)果即為文獻線索,對文獻線索進行整理,分析其相關(guān)程度。根據(jù)檢索的結(jié)果,判斷檢索策略式是否合適。如果檢索的結(jié)果不合適,就需要分析原因,修正檢索策略式。經(jīng)過反反復(fù)復(fù)的實驗性檢索,直到結(jié)果符合要求為止。

    3.5 獲取原始文獻

    對于全文數(shù)據(jù)庫,多數(shù)文獻可以直接下載全文。對于不能直接下載全文的文獻,可根據(jù)檢索結(jié)果中提供的文獻線索,索取原文。

    三、怎樣提取關(guān)鍵詞

    提取時,要注意以下三點:

    一是篩選陳述的對象(主要概念或主要事件)或議論的中心觀點。

    三是要注意與歸納概括信息題的不同。提取的關(guān)鍵性詞語的答案一般就在所給語段中,不需要我們自己去概括,或者用我們的理解來替代本來就存在的關(guān)鍵信息;而概括信息大多數(shù)情況則是對所給信息進行分析、歸納、整合,在語言表述上,可以是所給語段中現(xiàn)成的關(guān)鍵性詞語,也可以是高度概括了的能夠替代原語言信息的詞語。

    【考題再現(xiàn)】

    (2010年高考江蘇卷第3題)閱讀下面一段文字,找出“碳鏈式反應(yīng)”過程的三個關(guān)鍵性詞語。

    科學家在喀斯特地貌的研究中,發(fā)現(xiàn)了一個復(fù)雜的碳鏈式反應(yīng)。當水流從空氣中“大口吮吸”二氧化碳并侵蝕石灰?guī)r時,持續(xù)不斷的吸碳過程就開始了。接著,在巖石表面自由流淌的酸性水流攜帶著大量碳酸氫根,隨著自然界的水循環(huán)輾轉(zhuǎn)奔向江河湖海。此時,浮游植物體內(nèi)的“食物加工廠”在急切地“找米下鍋”,它們驚喜地發(fā)現(xiàn),只要分泌一種叫做“碳酸酐酶”的催化劑,對水中的碳酸氫根“略施魔法”,等待加工的“米”——二氧化碳,就唾手可得。最終,光合作用將大量隨波逐流的碳轉(zhuǎn)化成有機碳,封存于水生生物體內(nèi)。

    【解析】

    1.讀題,明確題干要求以及文段的主要表述對象或主要事件或議論的中心觀點。本題題干要求就是找出“碳鏈式反應(yīng)”過程的三個關(guān)鍵性詞語,文段的主要表述對象就是碳鏈式反應(yīng)。

    2.整體把握段落,區(qū)分句間關(guān)系,劃分層次。本段落共有5句話,其中第1句話指出了說明的中心——科學家發(fā)現(xiàn)了碳鏈式反應(yīng)。再根據(jù)表示過程的“開始”“接著”“最終”三個序數(shù)詞,把其余的4句話分為三層,其中3、4句為一層,第2句、第5句各為一層。

    3.篩選與主概念相對應(yīng)的謂語動詞或總結(jié)性的詞語。根據(jù)上述分析,提取的關(guān)鍵詞是表示過程的,因此可以確定第1個層次與“開始”相對應(yīng)的核心動詞是“吸碳”,第2個層次與“接著”相對應(yīng)的核心動詞是“略施魔法”,第3層次與“最終”相對應(yīng)的核心詞是“光合作用”,由此可得出三個關(guān)鍵性詞語。

    【參考答案】

    (1)吸碳;(2)“略施魔法”;(3)光合作用。

    【牛刀小試】

    請篩選整合下面文字中的主要意思,提煉出關(guān)于“碳中和”定義的4個關(guān)鍵詞語,并要注意四個詞語的順序。

    “碳中和”的目的是為了環(huán)保。人們計算自己日?;顒又圃斓亩趸寂欧帕浚ㄖ苯拥暮烷g接的,并計算抵消這些二氧化碳所需的經(jīng)濟成本。人們可以通過植樹或其他環(huán)保項目吸收大氣中相應(yīng)的二氧化碳;個人也可以付款給專門企業(yè)或機構(gòu),由這些企業(yè)或機構(gòu)通過植樹或其他環(huán)保項目吸收大氣中相應(yīng)的二氧化碳。2006年,《新牛津美國字典》將“碳中和”評為當年年度詞匯。它已經(jīng)從最初由環(huán)保人士倡導(dǎo)的一項概念,逐漸獲得越來越多民眾支持,并且成為受到許多國家政府當局所重視的實際綠化行動。

    四、在信息檢索中需要注意哪些方面

    在信息檢索中需要注意的問題有以下

    1、正確分析信息檢索的主題,提取正確的關(guān)鍵詞

    2、優(yōu)先選擇綜合性的檢索工具,然后在選擇專業(yè)性檢索工具

    3、選擇知名度較高的檢索工具

    4、采取多種不同的檢索方法和途徑

    5、注重檢索策略的調(diào)整

    6、重視對檢索效果的評價

    以上就是關(guān)于信息檢索關(guān)鍵詞提取方法相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。


    推薦閱讀:

    如何在百度免費發(fā)信息(如何在百度免費發(fā)信息給對方)

    抖音實名認證怎么更改(抖音實名認證怎么更改信息)

    百度關(guān)鍵詞推廣2元一天(百度如何發(fā)布信息推廣)

    包頭定制景觀設(shè)計價格表(包頭定制景觀設(shè)計價格表圖片)

    動漫app排行榜(動漫app排行榜下載安裝)

    問大家

    蘇州書生商友信息科技有限公司在常州小程序開發(fā)行業(yè)有名嗎?在座的看官們有誰了解

    蘇州書生商友信息科技有限公司在馬鞍山小程序開發(fā)運營行業(yè)聽過嗎?大家說一下吧

    蘇州書生商友信息科技有限公司在天長公司企業(yè)郵箱行業(yè)名氣怎么樣?諸位童鞋們幫幫我

    蘇州書生商友信息科技有限公司在昆山00電話行業(yè)專業(yè)嗎?大仙們你們誰明白

    蘇州書生商友信息科技有限公司在南京中英文域名行業(yè)好嗎?諸位大哥們回答有紅包

    蘇州書生商友信息科技有限公司在張家港00電話行業(yè)可靠嗎?諸位大哥們回答有紅包

    蘇州書生商友信息科技有限公司在東至公司企業(yè)郵箱行業(yè)聽過嗎?諸位童鞋們幫幫我

    蘇州書生商友信息科技有限公司在亳州網(wǎng)店淘寶店鋪裝修行業(yè)是牌子嘛?幫個忙老板們能不能推薦一下

    蘇州書生商友信息科技有限公司在太倉企業(yè)郵箱行業(yè)值得信賴嗎?老板們有誰懂

    蘇州書生商友信息科技有限公司在安慶網(wǎng)站建設(shè)設(shè)計行業(yè)是大牌嗎?各位大仙們幫忙回一下

    濟南哪里有婚姻介紹所?成功率高、且正規(guī)誠信的那種?

    濟南哪個婚介服務(wù)中心比較正規(guī),結(jié)婚率高?

    請問濟南婚姻介紹里比較可靠,真誠又比較好的婚介機構(gòu)是哪家?