首页
/
每日頭條
/
科技
/
什麼樣的數據不需要歸一化
什麼樣的數據不需要歸一化
更新时间:2026-05-27 01:04:07

在喂給機器學習模型的數據中,對數據要進行歸一化的處理。

為什麼要進行歸一化處理,下面從尋找最優解這個角度給出自己的看法。

1 例子

假定為預測房價的例子,自變量為面積,房間數兩個,因變量為房價。

那麼可以得到的公式為:

什麼樣的數據不需要歸一化(為什麼要對數據進行歸一化處理)1

其中

什麼樣的數據不需要歸一化(為什麼要對數據進行歸一化處理)2

代表房間數,

什麼樣的數據不需要歸一化(為什麼要對數據進行歸一化處理)3

代表變量

什麼樣的數據不需要歸一化(為什麼要對數據進行歸一化處理)2

前面的系數。

其中

什麼樣的數據不需要歸一化(為什麼要對數據進行歸一化處理)5

代表面積,

什麼樣的數據不需要歸一化(為什麼要對數據進行歸一化處理)6

代表變量

前面的系數。

首先我們祭出兩張圖代表數據是否均一化的最優解尋解過程。

未歸一化:

什麼樣的數據不需要歸一化(為什麼要對數據進行歸一化處理)7

歸一化之後

什麼樣的數據不需要歸一化(為什麼要對數據進行歸一化處理)8

為什麼會出現上述兩個圖,并且它們分别代表什麼意思。

我們在尋找最優解的過程也就是在使得損失函數值最小的theta1,theta2。

上述兩幅圖代碼的是損失函數的等高線。

我們很容易看出,當數據沒有歸一化的時候,面積數的範圍可以從0~1000,房間數的範圍一般為0~10,可以看出面積數的取值範圍遠大于房間數。

2 影響

這樣造成的影響就是在畫損失函數的時候,

數據沒有歸一化的表達式,可以為:

什麼樣的數據不需要歸一化(為什麼要對數據進行歸一化處理)9

造成圖像的等高線為類似橢圓形狀,最優解的尋優過程就是像下圖所示:

什麼樣的數據不需要歸一化(為什麼要對數據進行歸一化處理)7

而數據歸一化之後,損失函數的表達式可以表示為:

什麼樣的數據不需要歸一化(為什麼要對數據進行歸一化處理)11

其中變量的前面系數幾乎一樣,則圖像的等高線為類似圓形形狀,最優解的尋優過程像下圖所示:

什麼樣的數據不需要歸一化(為什麼要對數據進行歸一化處理)8

從上可以看出,數據歸一化後,最優解的尋優過程明顯會變得平緩,更容易正确的收斂到最優解。

這也是數據為什麼要歸一化的一個原因。

End.

,
Comments
Welcome to tft每日頭條 comments! Please keep conversations courteous and on-topic. To fosterproductive and respectful conversations, you may see comments from our Community Managers.
Sign up to post
Sort by
Show More Comments
推荐阅读
山水自然風景手機壁紙高清
山水自然風景手機壁紙高清
大家早安,
2026-05-27
unsc11000是什麼材質
unsc11000是什麼材質
合金302是18%鉻/8%鎳奧氏體合金的變體,是不鏽鋼家族中最熟悉和最常用的合金。合金302是304碳含量稍高的版本,通常以帶狀和線狀形式出現。它是一種堅韌、可延展的牌号,具有相當的耐腐蝕性,無磁性,并且不能通過熱處理硬化。合金302通常在...
2026-05-27
目前5年的手機有沒有銷量
目前5年的手機有沒有銷量
根據“2022年上半年手機市場實情公布”的數據顯示,中國市場手機銷量約為1.34億台,同比下滑16.9%。從手機銷量來看,這是2015年至今最差的銷售數據。事實上,不僅中國的手機市場在下滑,全球手機市場都在下滑。一方面,全球經濟形勢并不樂觀...
2026-05-27
脂肪幹細胞治療肝髒細胞損傷嗎
脂肪幹細胞治療肝髒細胞損傷嗎
肝髒的重要性肝髒,是人體代謝功能的重要組成器官。在身體裡做着去氧化、儲存肝糖、分泌性蛋白質的合成等工作。同時肝髒也是少數能夠自我修複、天然更新失去組織的器官。隻要還有1/4的正常肝組織,就可以自己再次生成一個完全的肝髒。肝病在我國是常見病,...
2026-05-27
網站建設的完整流程和步驟
網站建設的完整流程和步驟
網站建設的完整流程和步驟?在互聯網流量爆發的時代,網站就是一個超級銷售員,而且還是個一對多的銷售員,承擔轉化線上訂單的作用很多企業都開始搭建企業手機版網站,但是因為缺乏建站經驗,不清楚網站建設的基本流程有哪些,今天告訴你網站建設的基本流程,...
2026-05-27
Copyright 2023-2026 - www.tftnews.com All Rights Reserved