說的這些都是表示單詞詞性的,adv.表示 副詞adj.表示 形容詞妳說的及物動詞和不及物動詞用 vt. 和 vi 表示v. 表示 動詞a. 是 adj. 的壹種簡略寫法,也是表示 形容詞ad.是 adv. 的簡略寫法,表示 副詞。
詞性標註(Part-Of-Speech tagging, POS tagging)也被稱為語法標註(grammatical tagging)或詞類消疑(word-category disambiguation),是語料庫語言學(corpus linguistics)中將語料庫內單詞的詞性按其含義和上下文內容進行標記的文本數據處理技術。
詞性標註可以由人工或特定算法完成,使用機器學習(machine learning)方法實現詞性標註是自然語言處理(Natural Language Processing, NLP)的研究內容。常見的詞性標註算法包括隱馬爾可夫模型(Hidden Markov Model, HMM)、條件隨機場(Conditional random fields, CRFs)等。
詞性標註主要被應用於文本挖掘(text mining)和NLP領域,是各類基於文本的機器學習任務,例如語義分析(semantic analysis)和指代消解(coreference resolution)的預處理步驟。
詞性標註是隨著語料庫的建立而提出的,在其發展初期是語料庫中語法分析器(parser)的組件之壹,詞性標註的早期工作包括賓夕法尼亞大學(University of Pennsylvania)TDAP(Transformations and Discourse Analysis Project)項目中的語法結構模型? 。
1971年,Barbara B. Greene和Gerald M. Rubin以Klein and Simmons (1963)為基礎開發了詞性標註系統TAGGIT,並首次對大規模詞庫Brown Corpus進行了詞性標註。