pyspark.sql.GroupedData.mean¶

GroupedData.mean(*cols: str) → pyspark.sql.dataframe.DataFrame¶

Computes average values for each numeric columns for each group.

mean() is an alias for avg().

Parameters

Examples

>>> df.groupBy().mean('age').collect()
[Row(avg(age)=3.5)]
>>> df3.groupBy().mean('age', 'height').collect()
[Row(avg(age)=3.5, avg(height)=82.5)]

pyspark.sql.GroupedData.max

pyspark.sql.GroupedData.min