> 大模型生成描述性统计(图表) ## 使用方法 以下是 `大模型生成描述性统计`的使用方法。 1.`数据对象`必须要有,且必须和数据集中的名字一致(大小写也一致) 2.`图像类型`必须要有,比如分布图、散点图等。可以要求模型返回多张图表,需向模型明确。 3.`生成代码`如果有误,或者想要修改,可以点击`编辑`按钮对R代码进行修改,保存后点击`运行`按钮即可。 ## 示例 **1. 散点图** 请用该数据集画一个散点图,X 轴是 bmi(身体质量指数),Y 轴是 charges(年度医疗费用),用 smoker(吸烟状态)来区分颜色。 **2. 箱线图** 请用该数据集画箱线图,把 charges 按 smoker 分组,看看吸烟 / 不吸烟人群的医疗费用分布。 **3. 直方图** 请用该数据集画 age(年龄)的直方图,分面按 sex(性别)排布,bin 宽度取 2(年龄区间)。 **4. 柱状图** 请用该数据集统计各 region(居住区域)的样本数量,画一个柱状图,颜色按 region 实际类别填充。 **5. 密度图** 请用该数据集画出 bmi 在 18~35 范围内,不同 sex 的 bmi 密度曲线,要求半透明重叠展示。 **6. 分组均值表** 请用该数据集按 sex 分组,计算每组 age、bmi、charges 的平均值、标准差,输出成结构化表格。 **7. 费用 - 年龄线性拟合图** 请用该数据集画 charges 和 age 的散点图,并加上回归直线,颜色按 smoker 区分。 **8. 交叉频数表** 请用该数据集统计 sex 与 smoker 的交叉频数(即 “男性吸烟 / 不吸烟人数、女性吸烟 / 不吸烟人数”),输出二维汇总表格。 **9. 儿童数量分布柱状图** 请用该数据集统计 children(受抚养者数量)的不同取值对应的样本数,画一个柱状图展示各数量的分布。 **10. 区域 - 费用箱线图** 请用该数据集画箱线图,把 charges 按 region 分组,对比不同区域的医疗费用差异,并用不同颜色标注。