最新 2019 年最佳开源软件榜单

BPF Compiler Collection 是一个 Linux 动态跟踪工具。无第三方模块依赖,该工具继承 BPF 这个强大的内核中虚拟机的功能,可对程序进行高效而且安全的跟踪。

Wasmer

它通过用于开发工具和语言服务器间通信的 JSON-RPC 标准,能够让编程工具提供实时反馈的详细信息并以此实现多种强大功能,比如符 搜寻、语法分析、代码自动补全、移至定义、描绘轮廓与重构等。

Serverless Framework

Istio 是一款强大的工具,旨在提供一种统一化的微服务连接、安全保障、管理与监控方式。Istio 项目能够为微服务架构提供流量管理机制,同时亦为其它增值功能(包括安全性、监控、路由、连接管理与策略等)创造了基础。

该项目利用久经考验的 Lyft Envoy 代理进行构建,可在无需对应用程序代码作出任何发动的前提下实现可视性与控制能力。

Envoy

Kong 是一个可扩展、快速的微服务 API 关,用于管理、保护与连接混合及云原生架构。Kong 运行于全部服务之前,默认提供断路器、运行状态检查、OAuth、转换、缓存与地理位置复制等功能,并可以通过插件实现各种扩展,例如身份验证、流量控制与可观察性等。

Kong 在 1.0 GA 的时候带来了 Service Mesh 能力,用户不仅可以将 Kong 部署为 API 关,还可以将其部署为独立的 Service Mesh 代理。Kong 插件能为 Service Mesh 提供开箱即用的关键功能,并能与其它云原生技术集成,包括 Prometheus、Zipkin、健康检查、canary 测试与蓝绿测试等。

Pulumi

Sysdig 是一个超级系统工具,比 strace、tcpdump、lsof 加起来还强大。它可用来捕获系统状态信息,保存数据并进行过滤和分析。使用 Lua 开发,提供命令行接口以及强大的交互界面。

Sysdig 提供了一组工具,不仅可以用于了解基于容器的应用的实际性能,而且可以及时发现各类异常状况与安全威胁。

Kraken

Anaconda 是一个 Python/R 发行版,用于科学计算和信 处理等领域,支持 Linux、Mac 与 Windows,包含了众多流行科学计算与数据分析等 Python/R 包。

Anaconda 与其它发行版之间最大的区别在于 Anaconda Navigator(用于启动应用程序与管理软件包的图形化桌面环境)与 Anaconda 的本地软件包管理器 Conda。

Kotlin

Julia 是一个新的高性能动态高级编程语言,语法与其它编程语言类似,易于其他语言用户学习。

Julia 拥有丰富的函数库,提供了数字精度、精致的增幅器(sophisticated amplifier)和分布式并行运行方式。核心函数库等大多数库是由 Julia 编写,但也用成熟的 C 和 FORTRAN 库来处理线性代数、随机数产生和字符串处理等问题。Julia 语言可定义函数并且根据用户自定义的参数类型组合再进行重载。

Hazelcast Jet

Apache Airflow 是一个数据管道监控工具,任何工作流都可以在这个使用 Python 编写的平台上运行。

Airflow 允许工作流开发人员轻松创建、维护和周期性地调度运行工作流(即有向无环图或成为 DAGs)的工具,包括数据存储、增长分析、Email 发送与 A/B 测试等跨越多部门用例。

Airflow 可以与 Hive、Presto、MySQL、HDFS、Postgres 和 S3 交互,并且提供了钩子使得系统拥有很好地扩展性。此外它还提供了一个基于 Web 的用户界面,可以可视化地查看管道的依赖关系、监控进度与触发任务等。

GridGain

Apache Druid 是一个专为事件数据的 OLAP 查询设计的数据存储系统,是一个用于大数据实时查询和分析的高容错、高性能分布式系统,旨在快速处理大规模的数据,并能够实现快速查询和分析。

Druid 具有出色的可伸缩性与快速的即时查询响应速度,它将流式摄取与 OLAP 风格的批量摄取以及搜索技术结合在一起,能够轻松对实时及历史数据进行切片、切块与转换。

TensorFlow

TensorWatch 是一个调试和可视化工具,专为 Microsoft Research 的数据科学、深度学习和强化学习而设计。它适用于Jupyter Notebook,可显示机器学习培训的实时可视化,并为模型和数据执行其它关键分析任务,此外,它还提供强大的训练前与训练后功能,包括模型图可视化、降维数据探索、模型统计以及用于卷积 络的多种预测解释器。

TensorWatch 旨在灵活且可扩展,因此还可以构建自己的自定义可视化 UI 和仪表板。除了传统的“所见即所得”方法外,它还具有针对实时 ML 训练流程执行任意查询的独特功能。

PyTorch

Transformers(以往称为 pytorch-transformers 和 pytorch-pretrained-bert)是用于 TensorFlow 2.0 和 PyTorch 的自然语言处理框架。

它提供了用于自然语言理解(NLU,Natural Language Understanding)和自然语言生成(NLG,Natural Language Generation)的最先进的通用架构,包括 BERT、GPT-2、RoBERTa、XLM、DistilBert 与 XLNet 等,具有超过 100 种语言的 32 种以上经过预训练的模型,以及 TensorFlow 2.0 和 PyTorch 之间的深度互操作性。

Ludwig

RAPIDS 是一套数据科学框架,能够在不放弃已有经验与技能的前提下实现机器学习加速。RAPIDS 能够利用内存内处理方式在 GPU 上直接训练机器学习模型,并且相比其它 GPU 训练方法,它的速度高几个数量级。

RAPIDS 所使用的数据分析工具与 Python 相关实现方案如 Pandas DataFrames 完全等效,同时又有所不同,在某些情况下只需要变更脚本中的 import 语句即可完成兼容。

MLflow

Kubeflow 是一个机器学习工具库,Kubeflow 项目旨在使 Kubernetes 上的机器学习变的轻松、便捷与可扩展,其目标不是重建其它服务,而是提供一种简便的方式找到最好的 OSS 解决方案。

Kubeflow 解决了长期以来困扰各类组织的两个现实问题:如何将机器学习研究从开发环境转移到生产环境;如何将遥测技术从生产环境转移回开发环境,以实现深度研究。

Delta Lake

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年10月11日
下一篇 2019年10月11日

相关推荐