python dataframe describe引數什麼意思

2021-07-16 08:26:39 字數 4540 閱讀 4579

1樓:校zhang長

count 數量

mean 平均值

std 標準差

min 最小值

25% 第一四分位數 (q1),又稱“較小四分位數”,等於該樣本中所有數值由小到大排列後第25%的數字。

50% 中位數

75% 同上類似

max 最大值

2樓:匿名使用者

describe()檢視資料的分佈情況

可返回變數和觀測的數量、缺失值和唯一值的數目、平均值、分位數等相關資訊

3樓:

pandas.series.describe

dataframe.describe(percentiles=none, include=none, exclude=none)

生成描述性統計,總結資料集分佈的中心趨勢,分散和形狀,不包括nan值。

分析數字和物件系列,以及混合資料型別的dataframe列集。 輸出將根據所提供的內容而有所不同。 有關詳細資訊,請參閱下面的註釋。

變數:1、百分位數:數字列表,可選

輸出中包含的百分位數。 全部應該在0和1之間。預設值為[.25,.5,.75],返回第25,第50和第75百分位數。

2、包括:'all',dtypes的列表或無(預設),可選

要包括在結果中的白名單資料型別。 忽略了系列。 以下是選項:

l 'all':輸入的所有列都將包含在輸出中。

l 類似dtypes的列表:將結果限制為提供的資料型別。 將結果限制為數字型別,提交numpy.

number。要將其限制為分類物件,請提交numpy.object資料型別。

字串也可以以select_dtypes的樣式使用(例如,df.describe(include = ['o']))。

l 無(預設):結果將包括所有數字列。

3、排除:型別為dtypes或none(預設),可選

從結果中忽略的黑名單資料型別。 忽略了系列。 以下是選項:

l 類似dtypes的列表:從結果中排除提供的資料型別。 選擇數字型別submit numpy.

number。要選擇分類物件,請提交資料型別numpy.object。

字串也可以以select_dtypes的樣式使用(例如,df.describe(include = ['o']))。

l 無(預設):結果將不排除任何內容。

返回:總結:系列/ dataframe的匯**計

註釋:對於數值資料,結果的索引將包括計數,平均值,標準差,最小值,最大值以及較低的百分位數和50。預設情況下,較低的百分位數為25,較高的百分位數為75.

50百分位數與中位數相同。

對於物件資料(例如字串或時間戳),結果的索引將包括count,unique,top和freq。頂部是最常見的價值。頻率是最常見的頻率。時間戳還包括第一個和最後一個專案。

如果多個物件值具有最高的計數,則計數和頂部結果將從計數最高的那些中任意選擇。

對於通過dataframe提供的混合資料型別,預設值僅返回數字列的分析。如果include ='all'作為選項提供,則結果將包括每種型別的屬性的並集。

可以使用include和exclude引數來限制dataframe中哪些列被分析輸出。分析系列時,引數將被忽略。

例子:描述數字系列。

>>> s = pd.series([1, 2, 3])

>>> s.describe()

count 3.0

mean 2.0

std 1.0

min 1.0

25% 1.5

50% 2.0

75% 2.5

max 3.0

描述一個分類系列。

>>> s = pd.series(['a', 'a', 'b', 'c'])

>>> s.describe()

count 4

unique 3

top a

freq 2

dtype: object

描述時間戳系列。

>>> s = pd.series([

... np.datetime64("2000-01-01"),

... np.datetime64("2010-01-01"),

... np.datetime64("2010-01-01")

... ])

>>> s.describe()

count 3

unique 2

top 2010-01-0100:00:00

freq 2

first 2000-01-01 00:00:00

last 2010-01-01 00:00:00

dtype: object

描述dataframe。預設情況下只返回數字欄位。

>>> df = pd.dataframe([[1, 'a'], [2, 'b'], [3, 'c']],

... columns=['numeric', 'object'])

>>> df.describe()

numeric

count 3.0

mean 2.0

std 1.0

min 1.0

25% 1.5

50% 2.0

75% 2.5

max 3.0

描述dataframe的所有列,而不管資料型別如何。

>>> df.describe(include='all')

numericobject

count 3.0 3

unique nan 3

top nan b

freq nan 1

mean 2.0 nan

std 1.0 nan

min 1.0 nan

25% 1.5 nan

50% 2.0 nan

75% 2.5 nan

max 3.0 nan

通過訪問dataframe作為屬性來描述列。

>>> df.numeric.describe()

count 3.0

mean 2.0

std 1.0

min 1.0

25% 1.5

50% 2.0

75% 2.5

max 3.0

name: numeric, dtype: float64

在dataframe描述中僅包含數字列。

>>> df.describe(include=[np.number])

numeric

count 3.0

mean 2.0

std 1.0

min 1.0

25% 1.5

50% 2.0

75% 2.5

max 3.0

在dataframe描述中只包含字串列。

>>> df.describe(include=[np.object])

object

count 3

unique 3

top b

freq 1

從dataframe描述中排除數字列。

>>> df.describe(exclude=[np.number])

object

count 3

unique 3

top b

freq 1

從dataframe描述中排除物件列。

>>> df.describe(exclude=[np.object])

numeric

count 3.0

mean 2.0

std 1.0

min 1.0

25% 1.5

50% 2.0

75% 2.5

max 3.0頂0踩0

python裡面我想知道這是什麼意思,a是一個dataframe,求詳解 5

4樓:雙子座的我

應該是 b = a的x列的所有第0位組成的陣列吧

橢圓的引數方程原理,橢圓的引數方程中角的意義是什麼想不透啊,具體點

橢圓的參bai數方程 中心點為 duh,k 主軸zhi平行於x軸時,標準方程dao 高中課本專在平面直角座標系屬中,用方程描述了橢圓,橢圓的標準方程中的 標準 指的是中心在原點,對稱軸為座標軸。f點在x軸 2張 橢圓的標準方程有兩種,取決於焦點所在的座標軸 1 焦點在x軸時,標準方程為 2 焦點在y...

請問數碼相機引數中的光學變焦倍數是什麼意思,有什麼作用

光學變焦俗話就是把遠處的東西拉近,跟望遠鏡很像。倍數就是把你拍的東西放大到原來的多少倍 個人建議和觀點供你參考 通俗點說,光學變焦是依靠光學鏡頭結構來實現變焦的,通過鏡片的移動來放大與縮小需要拍攝的景物,是真正有效實用的變焦方式,基本無損成像質量.數碼變焦實際上是畫面的電子放大,把原來ccd影像感應...

描述簡單物件特性的引數有哪些各有何物理意義

1.放大係數k k的物理意義 如果有一定的輸入變化量 q作用於過程,通過過程後被放大了k倍,變為輸出變化量 w。放大係數k對系統的影響 對控制通道的影響 放大係數越大,操縱變數的變化對被控變數的影響就越大,控制作用對擾動的補償能力強,有利於克服擾動的影響,餘差就越小 反之,放大係數小,控制作用的影響...