關鍵詞:詞語與詞匯 詞匯動態特性 詞頻累積百分比 高頻詞集中度
摘要:本文區分詞語和詞匯,詞語是個別詞,詞匯是詞語的集合體。過去討論不同詞匯的差異都只能列舉詞語的異同,無法呈現宏觀的詞匯特色。以斷代詞典所收錄的字詞來比較,也很難看出不同時代詞匯的差異。本文考查'中研院'所收集的上古漢語數字資源、近代漢語數字文本、現代漢語平衡語料庫、《唐詩三百首》、《宋詞三百首》、北京大學標記的《人民日報》1998年新聞稿以及臺灣通訊社1991—2002年所的新聞文字,論述詞語成千上萬,須要提煉出有意義的詞匯特色來區別詞匯異同。區別的關鍵在于詞語的使用而不在于詞語的有無,詞語使用表現在語流或文本中。因此,本文所提出的詞匯屬性稱為詞匯動態屬性。在語流中詞語出現次數高低可以排序,從排序中可以從最高詞頻往下累積,得出詞頻在全部詞語數目中的百分比。我們以詞頻統計中最高的15個詞語的詞頻累積百分比作為高頻詞集中度,以高頻詞集中度當作詞匯動態特性。從文本計算出來的詞匯動態特性能清楚劃分出所考查的古代、近代、現代、詩詞和新聞稿的詞匯屬性。希望這個計量性質的詞匯屬性對今后的詞匯研究有些助益。
語言學論叢雜志要求:
{1}摘要應能客觀反映論文主要內容和觀點,不加詮釋和評價性文寧,具有獨立性和自含性,一般不超過300字。
{2}來稿應具有科學性、創新性和實用性,研究設計及統計學方法正確,資料真實、數據可靠、論點鮮明、結構嚴謹、層次清楚、條理分明、詳略得當。
{3}表格一律采用三線表形式,表內數據要求同一指標有效位數一致,表格內的各項標目除計量單位符號外一律用中文書寫。
{4}注釋要完整規范,至少包括作者(編者)、譯者、文獻題目、出版單位、出版時間(及雜志出版期號)、所引內容頁碼等信息;外文注釋從其原有體例;引文出自互聯網的,請注明題名、詳細網址及訪問時間。
{5}論文正文后附作者簡介,格式參照:姓名(出生年月-),性別,籍貫,職稱,學位,單位,研究方向,聯系電話和郵箱。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社