中文文本分類中的特征選擇研究
- 文件介紹:
- 該文件為 pdf 格式(源文件可編輯),下載需要
20 積分
- 中文文本分類中的特征選擇研究
目的: 隨著信息技術不斷前進和互聯網技術的迅猛發展和普及,信息呈近乎爆炸的形式急速膨脹。無論網絡上、企業中或是個人系統上,都有海量的信息需要處理。文本作為計算機系統中信息的最重要表現形式之一,其增長速度更為驚人。如何在海量文本庫中搜尋、過濾和管理這些文本成為一個亟待解決的問題。作為數據挖掘技術的重要手段之一,基于機器學習的文本分類技術可以在較大程度上解決文本庫雜亂無章的現象,幫助人們將大量的文本自動分門別類,從而更好地把握文本信息,使信息的價值最大化。 在采用向量空間模型對文本進行表示的情況下,文本分類的最大特點和困難之一是特征空間的高維性和文檔表示向量的稀疏性。中文的詞條總數有二十多萬條,尋求一種有效的特征抽取算法,降低特征空間的維數,提高分類的效率和精度,成為文本自動分類中需要首先面對的重要問題。特征選擇是解決這個問題的有效方法。 本選題的核心目的就在于研究如何進行特征項的選取,使得分類的效率和效果最好。 思路: 首先需要理解中文文本分類技術以及應用的框架,熟悉中文文本分類技術的各個組成部分,然后搭建一個中文文本分類的輔助平臺(包括分詞組件、分類器、測試文檔集、訓練文檔集,大部分都可以從開源軟件或公開資料里獲得),在輔助平臺的基礎上研究特征相的提取并用實驗檢驗之。 方法: 通過閱讀大量的資料或文檔學習所要用的知識和技術,并通過實驗驗證自己的想法和理論。 相關支持條件: PC、java或C++開發環境、中文文本分類輔助平臺(自己搭建)、Internet ...
中文文本分類中的特征選擇研究_下載(pdf格式) 技術文檔
主站蜘蛛池模板:
久久人爽人人爽人人片av
|
久久日韩
|
91在线精品亚洲一区二区
|
久久婷婷五月国产色综合
|
特污兔午夜影院
|
欧美亚洲大片
|
偷拍小视频激情在线观看
|
日韩国产精品欧美一区二区
|
亚洲天堂一区
|
黄又色又污又爽又高潮动态图
|
精品人妻无码一区二区三区换脸
|
韩国xxxx色视频在线观看
|
免费国产成人高清视频网站
|
国产天堂亚洲国产碰碰
|
全部免费的毛片视频观看
|
久久视频精品38线视频在线观看
|
亚洲另类激情综合偷自拍图
|
男人激烈吮乳吃奶视频免费
|
国产一区二区三区不卡观
|
免费人成在线观看
|
中文字幕日韩一区二区三区不卡
|
性欧美丰满熟妇xxxx性
|
青青草视频免费观看
|
老妇肥熟凸凹丰满刺激
|
久久久久美女
|
小泽玛利亚的一级毛片的
|
欧美综合图片区
|
在线看片亚洲
|
成人久久18免费软件
|
国产啪在线|
欧洲美熟女乱av亚洲一区
|
亚洲毛片免费观看
|
一本色道无码道dvd在线观看
|
色吊丝永久在线观看最新免费
|
亚洲理论电影在线观看
|
亚洲乱理伦片在线观看中字
|
国产免费av一区二区三区
|
国产欧美日本亚洲精品五区
|
香港三日本三级少妇三级2021
|
这里有精品可以观看
|
天天躁日日躁狠狠躁人妻
|