非線性迴歸方程經過平均值嗎

綜合知識
關注：2.94W次

非線性迴歸方程不一定經過平均值。線性迴歸中，迴歸方程通常經過自變數和因變數的平均值，但是在非線性迴歸中，迴歸方程的形式不再是簡單的一次函式，因此不一定滿足經過平均值的條件。

小編還為您整理了以下內容，可能對您也有幫助：

非線性迴歸方程公式

非線性迴歸方程公式如下：

線性迴歸方程公式：b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)。線性迴歸方程是利用數理統計中的迴歸分析，來確定兩種或兩種以上變數間相互依賴的定量關係的一種統計分析方法之一，應用十分廣泛。

一、概念

線性迴歸方程中變數的相關關係最為簡單的是線性相關關係，設隨機變數與變數之間存線上性相關關係，則由試驗資料得到的點，將散佈在某一直線周圍。因此，可以認為關於的迴歸函式的型別為線性函式。

分析按照自變數和因變數之間的關係型別，可分為線性迴歸分析和非線性迴歸分析。如果在迴歸分析中，只包括一個自變數和一個因變數，且二者的關係可用一條直線近似表示，這種迴歸分析稱為一元線性迴歸分析。如果迴歸分析中包括兩個或兩個以上的自變數，且因變數和自變數之間是線性關係，則稱為多元線性迴歸分析。

二、計算方法

線性迴歸方程公式求法：

第一：用所給樣本求出兩個相關變數的(算術）平均值：

x_=(x1+x2+x3+...+xn)/n

y_=(y1+y2+y3+...+yn)/n

第二：分別計算分子和分母：（兩個公式任選其一）

分子=(x1y1+x2y2+x3y3+...+xnyn)-nx_Y_

分母=(x1^2+x2^2+x3^2+...+xn^2)-n*x_^2

第三：計算b：b=分子/分母

用最小二乘法估計引數b，設服從常態分佈，分別求對a、b的偏導數並令它們等於零，得方程組解為

其中，且為觀測值的樣本方差.線性方程稱為關於的線性迴歸方程，稱為迴歸係數，對應的直線稱為迴歸直線.順便指出，將來還需用到，其中為觀測值的樣本方差。

先求x，y的平均值X，Y

再用公式代入求解:b=(x1y1+x2y2+...xnyn-nXY)/(x1+x2+...xn-nX)

後把x，y的平均數X，Y代入a=Y-bX

求出a並代入總的公式y=bx+a得到線性迴歸方程

(X為xi的平均數，Y為yi的平均數)

非線性迴歸方程為什麼不過樣本中心？

非線性迴歸是指在因變數與一系列自變數之間建立非線性模型。線性與非線性並不是說因變數與自變數間是直線或曲線關係，而是說因變數是否能用自變數的線性組合來表示。如果經過變數轉換，兩個變數可以用線性來表達去關係，那麼可以用之前章節中介紹的方法進行擬合迴歸方程。但經過變數變化後，兩個變數關係仍然不能用線性形式來表達，則就會用到本節介紹的非線性迴歸分析方法。

非線性迴歸模型一般可以表示為：

其中：f(x, θ)為期望函式。該模型結構和線性迴歸函式非常相似，所不同的是期望函式可能為任意形式，甚至在有的情況下沒有顯式關係式，迴歸方程中的引數估計是通過迭代方法獲得的。

SPSS採用兩種迭代方法：Levenberg-Marquardt法和序列二次規劃法。

Levenberg-Marquardt法又叫做阻尼最小二乘法，是對Gauss-Newton法的改進。它有一個阻尼因子λ，用λ可以控制搜尋步長和方向。當λ=0時，即為Gauss-Newton法；當λ--∞，趨於零向量，即為最速下降法。Levenberg-Marquardt法的優勢在於對影響Gausss-Newton法有效性的病態二次項，也可以通過阻尼因子來控制。

序列二次規劃法主要思路是：形成基於拉格朗日函式二次近似的二次規劃子問題，而這些問題可以用任意一種二次規劃演算法求解，求得的解用來形成新的迭代公式，作為下一次搜尋的依據。用序列二次迴歸演算法求解非線性有約束問題時的迭代次數常比求解無約束問題時少，因為在搜尋區域內，序列二次規劃演算法可以獲得最大的搜尋步長和方向資訊

迴歸直線方程必過定點為什麼是x和y的平均數？

呵呵！計算【b】和【a】的時候怎麼計算的？忘了沒有？重視了沒有？

用那個【複雜的】公式算出 b 後，計算a時，是這樣計算的：a=y平均-b*x平均

這樣，那個《迴歸方程》自然是 y^=b*x^+(y平均-b*x平均）了

所以，在這個式子中，若 x^=x平均的時候，一定有 y^=b*x平均+y平均-b*x平均=y平均

即，迴歸方程一定過（x平均， y平均）點。

【至於為什麼必須那樣計算《迴歸方程》，那涉及到《高等數學》中的《偏導數》分析最小誤差理論，不是應用者必須掌握的知識。勸你還是不要太執著。（當然，將來若你有機會步入數學專業的理科學習，這也只是“小菜一碟”了！）】

怎麼用平均值法求工作曲線的迴歸方程？

算數平均值法求工作曲線，方法簡單、實用。

方法是：

1、設定：迴歸方程 Y = a X + b；

2、分別將工作曲線的自變數X、因變數Y的資料，代入迴歸方程式，可以得到多個方程；

3、將多個方程分為兩組，分別加和，成為兩組方程，在聯立，就可以求出a、b值；

4、將求出的 a、b值，代入 Y = a X + b，就得到算數平均值法求工作曲線的迴歸方程。

能不能告訴我為什麼迴歸直線必經過點（x的平均值，y的平均值）拜託>_<～

因為平均值點是作為唯一的準點其他點都基本是散落在迴歸直線的兩側

非線性迴歸方程怎麼進行檢驗

比較簡單的方法，加入方程是y=ax^3+bx^2+cx+d，使用變數替換x3=x^3,x2=x^2轉換為線性方程，就可以通過R的平方以及F值來檢驗迴歸方程的整體解釋力和顯著程度了。

為什麼迴歸方程必過平均數點

因為在計算迴歸方程的時候用平均數點算了引數K和B.不懂再問，希望採納。

spss非線性迴歸分析步驟

概述

按照自變數和因變數之間的關係型別，迴歸分析可分為線性迴歸分析和非線性迴歸分析。非線性迴歸的迴歸引數不是線性的，也不能通過轉換的方法將其變為線性。

原理

非線性迴歸是用來建立因變數與一系列自變數之間的非線性關係，與估計線性模型的線性迴歸不同，通過使用迭代估計演算法，非線性迴歸可估計自變數和因變數之間具有任意關係的模型。

對於看起來是非線性的模型，但是可以通過變數轉換化成線性的模型，稱之為本質線性模型。

操作方法

本節內容主要介紹如何確定並建立線性迴歸方程。包括只有一個自變數的一元線性迴歸和和含有多個自變數的多元線性迴歸。為了確保所建立的迴歸方程符合線性標準，在進行迴歸分析之前，我們往往需要對因變數與自變數進行線性檢驗。也就是類似於相關分析一章中講過的藉助於散點圖對變數間的關係進行粗略的線性檢驗，這裡不再重複。另外，通過散點圖還可以發現數據中的奇異值，對散點圖中表示的可能的奇異值需要認真檢查這一資料的合理性。

一、一元線性迴歸分析

用SPSS進行迴歸分析，例項操作如下：

單擊主選單Analyze / Regression / Linear…，進入設定對話方塊如圖7-9所示。從左邊變量表列中把因變數y選入到因變數（Dependent）框中，把自變數x選入到自變數（Independent）框中。在方法即Method一項上請注意保持系統預設的選項Enter，選擇該項表示要求系統在建立迴歸方程時把所選中的全部自變數都保留在方程中。所以該方法可命名為強制進入法（在多元迴歸分析中再具體介紹這一選項的應用）。具體如下圖所示：

請單擊Statistics…按鈕，可以選擇需要輸出的一些統計量。如Regression Coefficients(迴歸係數)中的Estimates，可以輸出迴歸係數及相關統計量，包括迴歸係數B、標準誤、標準化迴歸係數BETA、T值及顯著性水平等。Model fit項可輸出相關係數R，測定係數R2，調整係數、估計標準誤及方差分析表。上述兩項為預設選項，請注意保持選中。設定如圖7-10所示。設定完成後點選Continue返回主對話方塊。

迴歸方程建立後，除了需要對方程的顯著性進行檢驗外，還需要檢驗所建立的方程是否違反迴歸分析的假定，為此需進行多項殘差分析。由於此部分內容較複雜而且理論性較強，所以不在此詳細介紹，讀者如有興趣，可參閱有關資料。

使用者在進行迴歸分析時，還可以選擇是否輸出方程常數。單擊Options…按鈕，開啟它的對話方塊，可以看到中間有一項Include constant in equation可選項。選中該項可輸出對常數的檢驗。在Options對話方塊中，還可以定義處理缺失值的方法和設定多元逐步迴歸中變數進入和排除方程的準則，這裡我們採用系統的預設設定，如圖7-11所示。設定完成後點選Continue返回主對話方塊。

非線性迴歸的應用

對實際科學研究中常遇到不可線性處理的非線性迴歸問題,提出了一種新的解決方法。該方法是基於迴歸問題的最小二乘法,在求誤差平方和最小的極值問題上,應用了最優化方法中對無約束極值問題的一種數學解法——單純形法。應用結果證明,這種非線性迴歸的方法演算法比較簡單,收斂效果和收斂速度都比較理想。

迴歸方程的建立

對於上述這些可化為線性模型的迴歸問題，一般先將其化為線性模型，然後再用最小二乘法求出引數的估計值，最後再經過適當的變換，得到所求迴歸曲線。

在熟練掌握最小二乘法的情況下，解決上述問題的關鍵是確定曲線型別和怎樣將其轉化為線性模型。確定曲線型別一般從兩個方面考慮:一是根據專業知識，從理論上推導或憑經驗推測、二是在專業知識為力的情況下，通過繪製和觀測散點圖確定曲線大體型別。

舉例：

1 1790-1960某國人口變化資料：注意：即便線性方程對對觀測資料擬合相當好，但有關誤差項的性和方差假設有可能被破壞。原因是時間序列的資料誤差項往往不，誤差項大小有可能根據資料總體的大小而變化，意思就是，即便適合這個樣本的觀測量的方程，但是，不適合總體。根據經驗，人口增長模型不能被轉化為線性模型，所以，可以利用曲線迴歸或者非線性迴歸。進一步比較究竟是曲線迴歸好還是非線性迴歸好，需要建立新的殘差變數，這一步並不難，就是在spss中，相應分析的儲存子對話方塊中建立新的對應模型的變數。其實，有一個萬能公式：spss中，所有的“儲存”對話方塊的功能都是，在二維表視窗也就是spss的盛放資料視窗中建立新變數，這個新變數有預設名，是相應分析的重要結果。儲存新變數以後，需要根據殘差的序列圖進行判斷：最平穩的就是最合適的。

例2：血中藥物濃度和時間曲線呈非線性關係。

這個是根據專業背景知識而判斷。藥物不可能馬上見效，也許在血液中逐步或者突然見效。

例3:身高和體重，在青少年中，是呈直線關係，因為，青少年在不斷成長，但是，對於整個人的生命週期，確是曲線關係因為，成年人的身高一般是確定的。

像這樣的例子根本用直線迴歸擬合不了，也稱為非本質線性模型。對於這種實際情況，可以使用非線性迴歸的分段模型。最終目的是使殘差平方和最小。也就是在圖形中跟大多數散點接近。

spss操作注意：

1 初始值確定：

①利用簡單假設確定，例如，如果在所有變數中最大的一個個案值為178萬，就需要選擇200為初始值，再根據方程估計引數值。

②利用圖形或者圖形輔助，資料轉換

如果引數沒有初始值，也不能簡單的設定為0，最好是將它們設定為預計要改變的值大小。總之，就是想辦法找到一個比較合適的值，多設幾個，然後比較。也可以根據專業背景和重點，來設值。這個還可以根據數學計算，例如，方程二邊同時取對數。需要具體問題具體分析。

2 迭代和收斂：迭代是計算機自動計算的，例如將迭代設定為1000，意思就是計算機算了1000次，每一次都是根據上一次的結果的基礎進行再運算。當然，人工筆算需要算1000年。迭代不會永無止境的計算下去，而是收斂標準或者稱作最大迭代的設定後，不論得沒有得到結果，是否達到目標，都會停止。在結果輸出表格中有迭代的歷史記錄。這個表格就是過程表，每一步怎樣算的，都可以找到。因為迭代是計算機自動計算，例如，燒水，如果開了不斷電，水燒乾了就會起火，所以，機器需要人控制，它本身沒有情感。

spss操作：不論“計算變數”對話方塊或者“非線性迴歸”，和非線性迴歸的“損失函式”對話方塊都是很像的，有一個計算器算盤，函式組，函式和特殊變數。各種元素組合在一起，構成一個表示式，這個表示式構成一個新變數。只要用滑鼠將對應的元素加入到表示式中，然後檢查，或者事先在本上寫有表示式，對應好，基本就沒有問題。其實，spss許多操作根據文字可以猜出個大概。

3 損失函式：“非線性迴歸”對話方塊是對整個因變數的運演算法則，但是，損失函式是對某一個統計量的運演算法則，spss預設是使用最小殘差平方和找出非線性模型，也可以自己設定。在相應對話方塊中都有設定。可以這樣以為：損失函式就是估計誤差的函式，它是一個負面指標，越小越好。

4 引數約束：多數非線性模型中，引數必須在有意義的區間內。指的是在迭代過程中對引數的。分為線性約束和非線性約束。線性約束中將引數乘以常數但這個常數不能為其他引數或者自身。非線性約束中至少有一個引數和其他引數相乘或者相除或者進行冪運算。

結果：

1 估計引數的漸進相關矩陣：如果出現非常大的正值或者負值，可能因為模型中引數過多，也說明觀測量數目不足，但是不說明模型不擬合。

2 95%置信區間：如果95%置信區間不包括零，表明這個引數具有統計學意義。如果離零比較接近，下結論時候應慎重。

3 曲線擬合中計算出來的決定係數實際上是曲線直線化直線方程的決定係數，不一定代表變換前的變異解釋程度。也就是說二個模型的決定係數有可能不具有可比性。

引申：

1 曲線迴歸最好的模型和非線性迴歸最好的模型進行比較。從中挑選最合適的模型。通過儲存殘差變數然後繪製序列圖實現。

2 有很多時候，線性模型根本解決不了問題，因為，即便費了很大力氣轉化為線性模型，但是，卻扭曲了資料。例如不僅改變原來資料的正態性，還改變資料的方差齊性，性。並且，在精度要求比較高或者模型比較複雜時候，曲線迴歸也不能應用。所以這時候最好應用非線性迴歸模型。

為什麼線性迴歸方程必經（x的平均值，y的平

線性迴歸方程 ^Y=bx+a 必過 (X的平均值，Y的平均值) 為什麼啊？？???

因為算得的迴歸直線結果中，y=bx+a