?在本教程中,您将使用自动化机器学习在Power BI中创建和应用二进制预测模型。
本教程包括创建Power BI数据流的指导,以及使用数据流中定义的实体直接在Power BI中培训和验证机器学习模型。然后,我们使用该模型对新数据进行评分以生成预测。
首先,您将创建一个Binary Prediction机器学习模型,根据在线购物者的一组在线会话属性来预测他们的购买意图。本练习使用基准机器学习数据集。一旦一个模型被训练,Power BI将自动生成一个解释模型结果的验证 告。然后您可以查看验证 告,并将模型应用到您的数据中进行评分。
学习本教程前,请下载
本教程包括以下步骤:
-
使用输入数据创建数据流
-
创建和训练机器学习模型
-
查看模型验证 告
-
将模型应用于数据流实体
-
使用Power BI 表中模型的评分输出
使用输入数据创建数据流
本教程的第一部分是使用输入数据创建数据流。如以下各节所示,该过程采取了一些步骤,从获取数据开始。
获取数据
创建数据流的第一步是准备好数据源。在我们的案例中,我们使用来自一系列在线会话的机器学习数据集,其中一些最终达到了购买目的。数据集包含一组关于这些会话的属性,我们将使用它们来训练我们的模型。
您可以从UC Irvine 站下载数据集。就本教程而言,我们还可以通过此链接提供此功能。
创建实体
要在数据流中创建实体,请登录Power BI服务,并导航到启用了AI的专用容量的工作区。
如果还没有工作区,可以通过在Power BI服务的左侧导航菜单中选择“工作区”来创建一个工作区,然后在出现的面板底部选择“创建应用程序工作区 ”。这将在右侧打开一个面板,以输入工作区详细信息。输入工作空间名称,然后选择高级。使用单选按钮确认工作空间使用“专用容量”,并且已将其分配给已打开AI的专用容量实例。然后选择保存。

创建工作空间后,可以选择“欢迎”屏幕右下角的“ 跳过 ”,如下图所示。

选择工作区右上方的Create按钮,然后选择Dataflow。


选择Text/CSV File作为数据源,如下图所示。

在接下来出现的“ 连接到数据源”页面中,将以下指向online_shoppers_intention.csv的链接粘贴到“ 文件路径”或“ URL”框中,然后选择“ 下一步”:
https://raw.githubusercontent.com/santoshc1/PowerBI-AI-samples/master/Tutorial_AutomatedML/online_shoppers_intention.csv

Power Query Editor显示CSV文件中数据的预览。您可以通过更改右侧窗格中“名称”框中的值,将查询重命名为更友好的名称。例如,您可以将查询名称更改为Online Visitors。

Power Query会自动推断列的类型。您可以通过单击列标题顶部的属性类型图标来更改列类型。在此示例中,我们将“收入”列的类型更改为“真/假”。

选择“保存并关闭”按钮以关闭Power Query Editor。提供数据流的名称,然后在对话框上选择“保存 ”,如下图所示。

创建和训练机器学习模型
要添加机器学习模型,请在“动作”列表中为包含您的训练数据和标签信息的基本实体选择“应用ML模型”按钮,然后选择“添加机器学习模型”。

创建机器学习模型的第一步是识别历史数据,包括您想要预测的结果字段。模型将通过学习这些数据来创建。
对于我们使用的数据集,这是收入字段。选择Revenue作为“输出字段”值,然后选择Next。

接下来,我们必须选择要创建的机器学习模型的类型。Power BI分析您已经确定的结果字段中的值,并建议可以创建哪些类型的机器学习模型来预测该字段。
在本例中,由于我们正在预测用户是否会购买的二进制结果,因此建议使用二进制预测。因为我们对预测用户购买感兴趣,所以选择True作为您最感兴趣的收入结果。此外,您可以为自动生成的 告中使用的结果提供友好的标签,该 告将总结模型验证的结果。然后选择Next。

接下来,Power BI对您的数据样本进行初步扫描,并提出可能产生更准确预测的输入建议。如果Power BI不建议使用该字段,则会在其旁边提供说明。您可以选择更改选择,以仅包括您要模型研究的字段,或者可以通过选择实体名称旁边的复选框来选择所有字段。选择下一步接受输入。

在最后一步,我们必须为模型提供一个名称。将模型命名为“购买意图预测”。您可以选择减少培训时间以查看快速结果,也可以选择增加培训时间以获得最佳模型。然后选择保存并训练以开始训练模型。

培训过程将首先对历史数据进行采样和标准化,然后将数据集划分为两个新实体,即购买意向预测培训数据和购买意向预测测试数据。
根据数据集的大小,训练过程可能需要几分钟到上一个屏幕选择的训练时间。此时,您可以在数据流的“ 机器学习模型”选项卡中看到该模型。就绪状态表示该模型已排队等待训练或正在训练中。
您可以通过数据流的状态来确认正在对模型进行训练和验证。这将在工作区的Dataflows选项卡中显示为正在进行的数据刷新。

模型训练完成后,数据流将显示更新的刷新时间。您可以通过导航到数据流中的“机器学习模型”选项卡来确认模型已训练。您创建的模型应显示为“已训练”状态,并且“最后一次训练时间”现在应该更新了。

查看模型验证 告
要查看模型验证 告,请在机器学习模型选项卡中,选择模型的“操作”列中的“查看培训 告”按钮。该 告描述了您的机器学习模型可能如何执行。
在 告的“ 模型性能”页面中,选择“查看最重要的预测变量”以查看模型的最重要的预测变量。您可以选择一个预测变量,以查看结果分布如何与该预测变量关联。

您可以使用“模型性能”页面上的“概率阈值”切片器来检查其对模型的“精确度”和“调用”的影响。

告的其他页面描述了该模型的统计性能指标。
该 告还包括“培训详细信息”页面,该页面描述了运行的不同迭代,如何从输入中提取特征以及所使用的最终模型的超参数。
将模型应用于数据流实体
选择 告顶部的“应用模型”按钮以调用此模型。在“应用”对话框中,可以指定目标实体,该目标实体具有应该将模型应用于其的源数据。

出现提示时,您必须刷新数据流才能预览模型的结果。
应用模型将创建两个新实体,后缀分别为<model_name>和<model_name>。在我们的案例中,将模型应用于“在线访问者”实体将创建“在线访问者丰富的购买意图预测”,其中包括该模型的预测输出;以及“在线访问者丰富的购买意图预测”说明,其中包含针对该预测的特定记录最高影响者。
应用二进制预测模型将添加四列,其中包含预测的结果、概率得分、预测的最高记录特定影响者以及解释索引,每列均以指定的列名作为前缀。

数据流刷新完成后,您可以选择“在线访问者充实的购买意图预测”实体来查看结果。

在Power BI 表中使用模型的评分输出
要使用机器学习模型的评分输出,可以使用数据流连接器从Power BI桌面连接到数据流。现在,可以使用“在线访问者丰富的购买意图预测”实体将来自模型的预测合并到Power BI 表中。
*想要获得Power BI Desktop、Power BI Pro更多资源或正版授权的朋友,可以咨询【客服】了解哦~
标签:
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!