Hello,大家好我叫是Dream呀,一個有趣的Python博主,小白一枚,多多關照 ?
入門須知:這片樂園從不缺乏天才,努力才是你的最終入場券!
最后,愿我們都能在看不到的地方閃閃發(fā)光,一起加油進步
“一萬次悲傷,依然會有Dream,我一直在最溫暖的地方等你”,唱的就是我!哈哈哈~
第十章:K最近鄰算法
- ??10.3.1??
10.1橙子還是柚子
如何知道一個水果到底是柚子還是橙子呢?我知道,通常柚子比橙子更大、更紅。
一般而言,柚子更大更紅。這個水果又大又紅,很可能是柚子。但是下面的這樣的水果呢?
如何判斷這個水果是柚子還是橙子?一種方法是看它的鄰居。來看看離它最近的三個鄰居。
在這三個鄰居中,橙子比柚子多,因此這個水果很可能是橙子。祝賀你,你剛才是用的就是K最近鄰(KNN)算法進行了分類!
KNN算法雖然簡單但是卻很有用!要對東西進行分類時,可首先嘗試這種算法。例如:電影推薦系統(tǒng)。
10.2創(chuàng)建推薦系統(tǒng)
假如你要給用戶創(chuàng)建一個電影推薦系統(tǒng),從本質(zhì)上來說,這類似于前面的水果問題!你可以將所有用戶都放在一個圖表中。
這些用戶在圖表中的位置取決于其喜好,因此喜好相近的用戶距離較近。假如你想要給Alex推薦電影,可以找出五位與他最接近的用戶。
假如在電影的喜好方面,Justin、JC、Joey、Lance和Chris都和Alex差不多,因此他們喜歡的電影,很可能Alex也很喜歡。
但是還有一個重要的問題,怎么確定他們之間的相似程度呢?
10.2.1
在前面的水果示例中,你根據(jù)個頭和顏色來比較水果,換而言之,你比較的是個頭和顏色?,F(xiàn)在假設有三個水果,你可抽取它們的特征。
再根據(jù)這些特征繪圖:
這樣我們就可以來計算任意兩種物品之間的直線距離。
10.2.2
假設你不僅要為Alex推薦電影,還要預測她將給這部電影打多少分。為此,先找出與她最近的五個人。
順便說一句,我老說最近的五個人,其實并非一定要選擇5個最近的鄰居。這就是所說的K最近鄰。
假如你要預測Alex給電影打多少分,你可以參考另外五個人的打分,對其求平均值,這就是回歸!
你將使用KNN來做兩項基本工作——分類和回歸:
- 分類就是編組;
- 回歸就是預測結果。
10.3機器學習簡介
10.3.1
OCR指的是光學字符識別,這意味著你可拍攝印刷頁面的照片,計算機將自動識別出其中的文字。
如何識別出這個數(shù)字是什么呢?可使用KNN。
- 瀏覽大量的數(shù)字圖像,將這些數(shù)字的特征提取出來。
- 遇到新的圖像時,你提取該圖像的特征,再找出它最近的鄰居都是誰!
與前面的水果實例相比,OCR中的特征提取要復雜得多,但再復雜的技術也是基于KNN等簡單理念的。這些理念也可用于語音識別和人臉識別。你將照片上傳到Facebook時,它有時候能夠自動標出照片中的人物,這是機器學習在發(fā)揮作用!
OCR的第一步是查看大量的數(shù)字圖像并提取特征,這被稱為訓練!大多數(shù)機器學習算法都包含訓練的步驟:要讓計算機完成任務,必須先訓練它。
10.4小結
1.KNN用于分類和回歸,需要考慮最近的鄰居。
2.分類就是編組。
3.回歸就是預測結果(如數(shù)字)。
4.特征抽取意味著將物品轉換成一系列可以比較的數(shù)字。
5.能否挑選出合適的特征事關KNN算法的成敗。
最后的福利
??????最后一點小福利帶給大家:如果想快速上手python的小伙伴們,這個詳細整理PPT可以迅速幫助大家打牢python基礎,需要的小伙伴們可以下載一下 Python入門基礎教程全套+小白速成+學不會來找我!
還有自制表白神器,需要自取:
Python表白神器,源碼+解析+各種完美配置+浪漫新穎
好啦,這就是今天要給大家分享的全部內(nèi)容了
如果你喜歡的話,就不要吝惜你的一鍵三連了~
本文摘自 :https://blog.51cto.com/u