任何人都可以提供一些關於如何使用 weights的建議   R的 lm論證   功能? 比方說,例如,您試圖在交通資料上擬合模型,並且您有几百行,每行代表一个城市(人口不同).如果您希望模型根据種群大小調整每个观察的相對影响,您可以簡單地指定 weights=[the column containing the city's population] ? 是那種可以进入 weights的矢量 ? 或者你需要完全使用不同的R函式/包/方法吗?

很想知道人们如何解決這个問题 - 在我看到的任何線性建模教程中都没有看到它.谢谢!

最新回復
  • 2019-12-5
    1 #

    我认為是 lm的R帮助頁面   很好地迴答你的問题.權重的唯一要求是提供的向量必须与資料的长度相同.您甚至可以只提供資料集中變數的名稱,R將負责其餘部分,NA管理等。您還可以在 weight中使用公式   論點.這是一个例子:

    x <-c(rnorm(10),NA)
    df <- data.frame(y=1+2*x+rnorm(11)/2, x=x, wght1=1:11)
    ## Fancy weights as numeric vector
    summary(lm(y~x,data=df,weights=(df$wght1)^(3/4))) 
    # Fancy weights as formula on column of the data set
    summary(lm(y~x,data=df,weights=I(wght1^(3/4))))
    # Mundane weights as the column of the data set
    summary(lm(y~x,data=df,weights=wght1))
    

    請註意,權重必须為正數,否則R將产生錯誤。

  • 2019-12-5
    2 #

    您的建議應该起作用.看看這是否有意義:

    lm(c(8000, 50000, 116000) ~ c(6, 7, 8))
    lm(c(8000, 50000, 116000) ~ c(6, 7, 8), weight = c(123, 123, 246))
    lm(c(8000, 50000, 116000, 116000) ~ c(6, 7, 8, 8))
    

    第二行产生与第三行相同的截距和斜率(与第一行的結果不同),给出一个观察值相對於其他两个观察值的每一个的两倍的重量,類似於重複第三次观察的影响 .

  • resampling:使用模擬分佈校正多重比较
  • r:如何在nlme中获得效果大小?