今年早些时候,微软在Power BI中引入了自动机器学习(AutoML)作为公开预览。现在,Power BI中的AutoML通常可用于Power BI Premium和Embedded可用的所有公共云区域。
在Power BI中使用AutoML,在机器学习方面没有丰富背景的业务分析师可以构建ML模型来解决曾经需要数据科学家的业务问题。ML模型创建背后的大多数数据科学都是由Power BI自动化的,同时提供全面的见解,使您可以直观地了解用于创建ML模型的过程。因为AutoML针对的分析师可能没有构建ML模型的经验,所以开发团队在添加自动防护方面进行了大量投资,比如类平衡、训练测试数据分割、交叉验证、缺失值估算和高基数特征检测,以确保生成的模型具有良好的质量。
荷兰提供全方位服务的数字公司Macaw在Power BI中部署了自动机器学习,以快速获取销售数据,并在Power BI中直接培训、验证和调用机器学习模型。Macaw的首席数据和人工智能顾问戴夫吉特(Dave Ruijter)分享道:“Power BI内部的自动化功能帮助我们衡量如何将解决方案与AI功能融合在一起。”现在,Macaw Power BI分析师可以将机器学习纳入他们的解决方案中,而无需数据科学家的参与。他们的客户之一、Shoeby的合伙人兼首席信息官米奇森(Mitch van Deursen)表示:“通常情况下,建模需要几个月的时间,而现在我们能在5天内得到关键业务问题的答案。”
随着公共预览版的发布,AutoML in Power BI允许用户:
-
训练机器学习模型以执行二进制预测,一般分类和回归
-
查看模型训练 告
-
将ML模型应用于他们的数据,并查看预测和解释
开发团队一直在改进并在Power BI中为AutoML添加新功能。
非布尔结果的二进制预测支持
早些时候,AutoML期望二进制预测模型的结果字段为布尔值。现在,开发团队在结果字段中也支持非布尔值。在向导中,您可以直接选择最感兴趣的目标结果,从而节省了将其转换为布尔值的预处理步骤。

改进功能推荐
开发团队改进了统计方法,这些统计方法建议了可用于训练ML模型的输入字段。现在,Auto ML将分析所选实体的样本、推荐字段,并显示不建议使用字段的原因。如果某个字段具有太多不同的值或只有一个值,或与输出字段的相关性较低或较高,则不建议使用此方法。

控制训练时间
现在,AutoML允许您控制训练模型的时间。
您可以选择减少培训时间来查看快速结果,或者增加用于培训的时间来获得最佳模型。前者在构建POC或确保选择了正确的字段时非常有用。

改进的培训 告
培训 告已经改进,使其更具可读性。此外,现在生成 告的速度快了两倍。
二元预测 告现在包括一个成本效益分析工具。给定目标的估计单位成本和实现目标结果的单位收益,它可以帮助您应该以产生最高利润为目标的人群子集。

可解释的AI
AutoML强调预测的可解释性,以提供对最重要字段的可见性。它提供了训练过程中的最佳预测变量,以及对ML模型在评分过程中产生的每个预测的解释。
改进了“最佳预测变量”部分,以显示可理解的功能细分,因此您可以轻松地验证模型是否与您对结果字段的业务洞察力保持一致。 在下面的房价预测示例中,“ sqft_living”(右侧)的功能细分图表显示,较高的“ sqft_living”值具有较高的房价。

除此之外,开发团队还增加了对顶级预测变量中文本功能的支持。
现在,将对预测的解释作为一个单独的实体出现,以使其易于访问和阅读。为了使模型预测可解释,我们显示了每个特征对预测的贡献,这些贡献加起来等于预测值。
在下面的房价预测示例中,您可以看到一些功能具有正面影响(绿色),而其他功能则具有负面影响(红色)。 将这些贡献加到基值(在这种情况下,训练数据中房屋价格的平均值)中,得出的预测房屋价格为379,738美元,从而使您可以轻松地解释这些模型预测。

使用这个解释实体,不久将提供自动生成的解释 告,您可以快速构建解释模型预测的 告。
开始构建自己的ML模型
这篇教程,展示了如何使用Auto ML构建您的机器学习模型。赶紧下载Power BI Desktop、Power BI Pro体验自动机器学习功能,构建自己的ML模型吧!
*想要获得Power BI Desktop、Power BI Pro更多资源或正版授权的朋友,可以咨询【客服】了解哦~
标签:
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!