点击左上方蓝字关注我们
使用 Depix 从像素化图像截图中恢复文字密码,操作也比较简单:
-
从截图中分割出矩形像素化 block;
-
给该序列截图,尽可能使用和像素化图像相同的截图工具。
-
执行命令:
Depix 算法利用线性方框滤波器单独处理每一个 block 这一事实。它对搜索图像中的每一个 block 执行像素化以寻找直接匹配。
对于大部分像素化图像,Depix 尽量寻找单匹配结果,并假设这些匹配是正确的。至于周围多匹配 block 的结果被看作像素化图像中相同的几何距离,并认为这些匹配也是正确的。该过程重复多次。
在正确的 block 没有更多几何匹配后,Depix 将直接输出所有正确的 block。对于多匹配 block,Depix 将输出所有匹配的平均值。像素化常使用线性方框滤波器实现。线性方框滤波器的实现很简单,速度很快,可以并行处理多个 block。
由于线性方框滤波器是一种确定性算法,对同样的值执行像素化通常会产生同样的像素化 block。使用同样位置的 block 对相同文本执行像素化,会得到同样的 block 值。我们可以尝试像素化文本来找出匹配的模式。幸运的是,这对于秘密值的一部分同样奏效。我们可以把每个 block 或 block 组合看作一个子问题。
创建字母的德布鲁因序列时加上空格显然会带来同样的问题:算法无法找到后续字母的恰当 block。有空格又有字母的图像需要更长的搜索时间,但结果也更好。
对于大部分像素化图像而言,Depix 似乎能够找到 block 的单匹配结果,并假设这是正确的。然后将其周围多匹配 block 的匹配结果看作在像素化图像中处于相同的几何距离,并假设这些匹配也是正确的。
在正确的 block 没有更多几何匹配后,Depix 直接输出所有正确的 block。对于多匹配 block,Depix 将输出所有匹配的平均值。虽然 Depix 的输出并不完美,但已经算不错了。下图展示了包含随机字符的测试图像的去像素化结果,大部分字符被正确读取:
最近,在GitHub Universe上,一款「暗黑」模式被推了出来。官方自称:「2020年宇宙新功能」。
设置黑暗模式的地址如下:
https://github.com/settings/appearance
Dark Mode 一经宣布,就在reddit上面获得了4k的高赞, 友也纷纷:这是有史以来最好的体验!
此外,Github还发布了非常多的新特性,感兴趣的童鞋可以戳下方链接观看:
https://www.youtube.com/watch=AiWjanAdD3s&t=13m22s
03
与AI一起书写未来,百度吴甜入选中国最具影响力的商界女性未来榜
“中国最具影响力的商界女性”自2004年评选至今,已经引起了 会广泛关注,格力电器董事长兼总裁董明珠、长城汽车公司总裁王凤英等均上榜。而此次是《财富》首次评选“中国最具影响力的商界女性(未来榜)”,除吴甜外,登上此榜单的还包括微软公司 SharePoint及Teams中国区总经理梁戈碧,InMobi公司高级副总裁、大中华区总经理杨娟等人。
吴甜作为百度集团副总裁,截至2020年已加入百度近15年。这期间,吴甜从百度知道研发起步到今年升任百度集团副总裁,经历了从PC互联 时代,到移动互联 时代,再到今天AI时代的发展,参与了AI创新建设的各个阶段,带领团队在人工智能重要方向上取得了大量业界领先的技术成果,并广泛应用于百度重要业务和产品。
这个壮举同时宣告了两件事:困扰生物界50年的蛋白质折叠难题被破解了;生物制药或将成为AI最新的疆域。
近期,一家AI制药公司再度「破圈」走进大众视野:AccutarBio宣布完成近亿美金的新一轮融资,由依图科技、春华资本、鼎晖投资、IDG资本联合投资。
作为AccutarBio的A轮领投方,IDG资本合伙人周全对AccutarBio的评价说:「AccutarBio公司拥有着业界最强的AI+制药的综合团队,开发了业内领先的全套临床前AI解决方案,并有多个药物开发管线将于明年进入临床试验,成功地打通了从人工智能药物设计到临床候选分子的全路径。」
与AlphaFold类似,AccutarBio也是一个关键比赛的冠军缔造者——激酶抑制剂类药物亲和力预测挑战赛(DREAM Challenge),这是生物医药领域最具影响力的开放数据建模旗舰竞赛,对药物研发更具直接指导意义。
而谷歌自然也不落后,在今年年初谷歌公布的一项研究结果显示「人工智能在乳腺癌检测方面的准确率做的比人类医生更高」。
在实践中,谷歌的研究发现,与人类医生相比,人工智能不仅准确率更高,而所需的信息也更少——有时仅依靠X射线图,就可以完成诊断。
在一个可期的未来中,全球数百万的患有乳腺癌的女性都能及时地发现乳腺癌并提早治疗。
除了互联 软件公司,各大硬件厂商也纷纷加入这一技术应用的大潮流,如「英伟达」和「英特尔」等公司。
英伟达作为全球第一的GPU厂商,也拿出了自己的看家本领,在图像识别上下足了功夫。
kaggle 历时一个月,完成了此项调查 告
目前,最近调查 告已出炉。从这个 告中,我们可一览当前机器学习与数据科学从业者的全貌,以及相关企业在这方面的人员雇佣、资金投入状况等,一窥该行业最新发展趋势。
告精炼版:数据科学er的群体画像
性别、年龄与学历分布
-
该领域从业人员男多女少,男女比例约为 5:1
-
35 岁是个分水岭,大部分受访者小于 35 岁
-
一半以上的受访者拥有研究生学位
教育背景和工作经验
-
大多数数据科学家走出校门后,仍坚持学习新技术
-
大多数数据科学家编程时间少于 10 年
-
一半以上的数据科学家,拥有机器学习的经验不足三年
-
居住美国的数据科学家的工作薪水,明显比其他国家同行更多
技术相关调查
-
相比 2019 年,使用云计算的数据科学家更多了
-
Scikit-Learn 是使用最多的机器学习工具,有 4/5 的数据科学家在用
-
Tableau 和 PowerBI 是最流行的商业智能工具
数据科学家从业者仍然存在巨大的性别比例失衡,超过八成都是男性。
在参与此次 Kaggle 年度调查的数据科学家中,印度的数据科学家占 22%,而美国的占 14.5%,两者远远超过第三位的巴西(低于 5%)。
告因为各项因素,并未将中国明确列入,但排名第三的 Other 的数量不低,也许是为纳入有效统计结果的中国用户。
数据科学和机器学习正在迅速改变,所以受访者中,超九成仍会继续保持学习。其中,大约 30% 的人选择了传统的高等教育课程,更多的人则通过在线资源学习。
在本次调查中,Coursera、Udemy 和 Kaggle Learn 是最常见的学习平台。
编程经验对于数据科学家来说较为重要
kaggle 告:
https://storage.googleapis.com/kaggle-media/surveys/Kaggle%20State%20of%20Machine%20Learning%20and%20Data%20Science%202020.pdf
飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术领先、功能完备的产业级深度学习平台,包括飞桨开源平台和飞桨企业版。飞桨开源平台包含核心框架、基础模型库、端到端开发套件与工具组件,持续开源核心能力,为产业、学术、科研创新提供基础底座。飞桨企业版基于飞桨开源平台,针对企业级需求增强了相应特性,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业,提供零门槛、预置丰富 络和模型、便捷高效的开发平台;BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。
END

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!