点击展开

大数据挖掘

OB电竞:20 个案例详解 Pandas 当中的数据统计说明与排序
2022-05-22 02:51:25 | 来源:OB电竞官网 作者:ob电竞官网下载

  自己编程游戏的软件

  value_counts 格式,顾名思义,重倘应用于准备各个种别涌现的次数的,而 sort_values 格式则是对数值来举办排序,当然除了这些,又有许多公共不明了的衍生的功效等候被发掘,下面幼编就带公共一个一个的说过去。

  咱们这回用到的数据集是“至极出名”的泰坦尼克号的数据集,该数据源可以正在许多平台上都可以找获得

  上面返回的结果是依据从大到幼来举办排序的,当然咱们也可能反过来,从幼到大来举办排序,代码如下

  默认的是 value_counts 格式不会对空值举办统计,那倘使咱们也盼望对空值举办统计的话,就可能加上 dropna 参数,代码如下

  咱们可能将数值的统计转化成百分比式的统计,可能愈加直观地看到每一个种另表占比,代码如下

  倘使咱们盼望对可以正在后面加上一个百分比的符号,则需求正在 Pandas 中加以树立,对数据的涌现加以树立,代码如下

  和 Pandas 模块当中的 cut 格式相形似的正在于,咱们这里也可能将持续型数据举办分箱然后再来统计,代码如下

  咱们将 Fare 这一列一律份的分成3组然后再来举办统计,当然咱们也可能自界说每一个分组的上限与下限,代码如下

  pandas 模块当中的 groupby 格式批准对数据集举办分组,它也可能和 value_counts 格式联用更好地来举办统计阐明,代码如下

  上面的代码是针对“Embarked”这一种别下的“Sex”特质举办分组,然后再进一步举办数据的统计阐明,当然出来的结果是 Series 数据机闭,倘使咱们念让 Series 的数据结果编程 DataFrame 数据机闭,可能这么来做,

  下面咱们来说一下数据的排序,重要用到的是 sort_values 格式,比方咱们遵循“岁数”这一列来举办排序,排序的办法为降序排,代码如下

  咱们看到排序过之后的 DataFrame 数据集行索引仍然没有变,咱们盼望行索引仍然可能是从0初步挨次的递增,就可能这么来做,代码如下

  咱们可能看到正在“Age”一律的处境下,“Fare”字段是依据升序的秩序来排的

  咱们可能自界说一个函数格式,然后行使正在 sort_values 格式当中,让其依据己方写的格式来排序,咱们看如下的这组数据

  当中的“cost”这一列带有美元符号“$”,以是就会滋扰排序的寻常举办,咱们应用 lambda 格式自界说一个函数格式行使正在 sort_value 当中

  当然咱们还可能自界说一个愈加纷乱一点的函数,而且行使正在 sort_values 格式当中,代码如下

  又有其余一种处境,比方咱们遭遇衣服的尺码, XS 码、 S 码、 M 码、 L 码又或者是月份, Jan 、 Feb 、 Mar 、 Apr 等等,需求咱们己方去界说巨细,这个岁月咱们需求用到的是 CategoricalDtype

ob电竞官网下载
OB电竞官网

ob电竞官网下载

联系电话:176 0301 6881

邮箱:sales@finscm.com

OB电竞官网