2021 年最佳开源软件出炉,你用过哪些?

11个月前 (02-10 12:47)阅读3回复2最佳爬楼位置
zaibaike
zaibaike
  • 管理员
  • 注册排名1
  • 经验值531812
  • 级别管理员
  • 主题106362
  • 回复1
楼主

2021 年更佳开源软件出炉,你用过哪些?

转自 | OSC开源社区

本文是 InfoWorld 2021 年公布的《更佳开源软件榜单》翻译稿。

InfoWorld 是一家信息手艺媒体公司,成立于 1978 年目前从属于 IDG。每年 InfoWorld 城市按照软件对开源界的奉献,以及在业界的影响力评选出昔时的“更佳开源软件” (BOSSIE),该奖项评选已经延续了十多年。

本次获奖的 29 个开源项目包罗:软件开发、开发、云原生计算、机器进修等类型,下面我们一路来看看,有没有熟悉的面目面貌!

1、Svelte 和 SvelteKit

在浩瀚立异的、开源的、前端的 JavaScript 框架中,Svelte 及其全栈对应的 SvelteKit 可能是最有野心和远见的。Svelte 一起头就通过接纳编译时战略来倾覆现状,并以超卓的性能、持续的开展和卓越的开发者体验向前迈进。SvelteKit 现已进入公测阶段,它延续了 Svelte 的传统,通过接纳最新的东西,并将摆设到无办事器情况做为一项内置功用来实现飞跃。

地址:https://github.com/sveltejs/svelte

2、Minikube

Minikube 是一个易于在当地运行 Kubernetes 的东西,可在你的条记本电脑上的虚拟机内轻松创建单机版 Kubernetes 集群。便于测验考试 Kubernetes 或利用 Kubernetes 日常开发。

地址:https://github.com/kubernetes/minikube

3、Pixie

Pixie 是 Kubernetes 应用的可察看性东西,它能够查看集群的高级形态,如办事地图、集群资本和应用流量;还能够深切到更详细的视图,如 pod 形态、火焰图和单个 full-body 应用恳求。Pixie 利用 eBPF 主动搜集遥测数据,它在集群当地搜集、存储和查询所有的遥测数据,利用不到 5% 的集群 CPU。Pixie的用例包罗集群内的收集监控、根底设备安康、办事性能和数据库查询分析。

地址:https://github.com/pixie-io/pixie

4、FastAPI

FastAPI 是一个高性能 Web 框架,用于构建 API。次要特征:

快速:十分高的性能,与 NodeJS 和 Go 相当 快速编码:将功用开发速度进步约 200% 至 300% 更少的错误:削减约 40% 的报酬错误 曲不雅:强大的编纂器撑持,主动补全无处不在,调试时间更少 简易:旨在易于利用和进修,削减阅读文档的时间。 简短:削减代码反复。 稳健:获取可用于消费情况的代码,具有主动交互式文档 基于尺度:基于并完全兼容 API 的开放尺度 OpenAPI 和 JSON Schema

地址:https://github.com/tiangolo/fastapi

5、Crystal

做为一个供给具有 C 语言的速度和 Ruby 语言的表示力的编程语言的项目,Crystal 已经开发了好几年了。跟着本年岁首年月 Crystal 1.0 的发布,该语言如今已经足够不变到能够用于一般工做负载。Crystal 利用静态类型和 LLVM 编译器来实现高速度,并制止在运行时呈现空引用等常见问题。Crystal 能够与现有的 C 代码接口,以进一步进步速度和便当性,它还能够利用编译时宏来扩展根底语言的语法。

地址:https://github.com/crystal-lang/crystal

6、Windows Terminal

Windows Terminal 是一个全新的、流行的、功用强大的号令行末端东西。包罗良多来社区呼声很高的特征,例如:多 Tab 撑持、富文本、多语言撑持、可设置装备摆设、主题和款式,撑持 emoji 和基于 GPU 运算的文本衬着等等。同时该末端仍然契合我们的目的和要求,以确保它连结快速、高效,而且不会消耗大量内存和电源。

地址:https://github.com/Microsoft/Terminal

7、OBS Studio

OBS Studio 是一款用于实时流媒体和屏幕录造的软件,为高效捕捉,合成,编码,记录和传播输视频内容而设想,撑持所有流媒体平台。

高性能实时视频/音频捕捉和混合。创建由多种来源构成的场景,包罗窗口捕捉、图像、文本、阅读器窗口、收集摄像头、捕捉卡等。 设置无限数量的场景,用户能够通过自定义过渡无缝切换。 带有每个源滤波器的曲不雅音频混合器,例如噪声门,噪声按捺和增益。全面控造VST插件撑持。 强大且易于利用的设置装备摆设选项。添加新源,复造现有源,并轻松调整其属性。 精简的设置面板利用户能够拜候各类设置装备摆设选项,以调整播送或录造的各个方面。 模块化的“Dock” UI允许用户完全按照需要从头摆列规划。用户以至能够将每个零丁的 Dock 弹出到本身的窗口中。

地址:https://github.com/obsproject/obs-studio

8、Shotcut

Shotcut 是一款跨平台的视频编纂东西,允许人们在应用效果和分层的同时,对音频和视频轨道停止所有的尺度批改。Shotcut 有一个十分活泼的社区,并供给大量的操做视频和指点,以帮忙新手和高级摄像师。它能够在 Mac、Linux、BSD 和 Windows 上运行--虽然是跨平台的,但与同类东西比拟,它的界面很敏捷,利用起来也相对简单。

地址:https://github.com/mltframework/shotcut

9、Weave GitOps Core

Weave GitOps 撑持有效的 GitOps 工做流,以将应用法式持续交付到 Kubernetes 集群中。它基于领先的 GitOps 引擎 CNCF Flux。

地址:https://github.com/weaveworks/weave-gitops

10、Apache Solr

Apache Solr 是基于 Lucene 的全文搜刮办事器,也是更流行的企业级搜刮引擎。Apache Lucene 是你所利用的大部门软件的搜刮功用背后的根底搜刮手艺--包罗其他搜刮引擎,如 Elasticsearch。与 Elasticsearch 差别的是,Solr 放弃了它的开源答应,不外它仍然是免费的。Solr 是可集群的、可在云端摆设的,而且强大到足以成立云端级的搜刮办事。它以至包罗 LTR 算法,以帮忙主动调整和加权成果。

地址:https://github.com/apache/solr

11、MLflow

MLflow 由 Databricks 创建,并由 Linux 基金会托管,是一个 MLOps 平台,能够让人跟踪、办理和维护各类机器进修模子、尝试及其摆设。它为你供给了记录和查询尝试(代码、数据、设置装备摆设、成果)的东西,将数据科学代码打包成项目,并将那些项目链入工做流程。

地址:https://github.com/mlflow/mlflow

12、Orange

Orange 旨在使将数据发掘"富有效果且有趣"。Orange 允许用户创建一个数据阐发工做流程,施行各类机器进修和阐发功用以及可视化。与 R Studio 和 Jupyter等法式化或文本东西比拟,Orange 长短常曲不雅的。你能够将小部件拖到画布上以加载文件,用模子阐发数据并将成果可视化。

地址:https://github.com/biolab/orange3

13、Flutter

Flutter 由 Google 的工程师团队打造,用于创建高性能、跨平台的挪动应用。Flutter 针对当下以及将来的挪动设备停止优化,专注于 Android and iOS 低延迟的输入和高帧率。它能够给开发者供给简单、高效的体例来构建和摆设跨平台、高性能挪动应用;给用户供给标致、快速、jitter-free 的 app 体验。

地址:https://github.com/flutter

14、Apache Superset

Apache Superset 是 Airbnb (出名在线房屋短租公司)开源的数据探查与可视化平台(曾用名 Panoramix、Caravel ),该东西在可视化、易用性和交互性上十分有特色,用户能够轻松对数据停止可视化阐发。Apache Superset 也是一款企业级贸易智能 Web 应用法式。

地址:https://github.com/apache/superset

15、Presto

Presto 是一个开源的散布式 SQL 引擎,用于在线阐发处置,在集群中运行。Presto 能够查询各类各样的数据源,从文件到数据库,并将成果返回到许多贸易智能和阐发情况。更重要的是,Presto 允许查询数据所在的处所,包罗 Hive、Cassandra、关系型数据库和专有数据存储。一个 Presto 查询能够连系多个来源的数据。Facebook 利用 Presto 对几个内部数据存储停止互动查询,包罗他们的 300PB 数据仓库。

地址:https://github.com/prestodb/presto

16、Apache Arrow

Apache Arrow 为平面和分层数据定义了一种独立于语言的柱状内存格局,为现代 CPU 和 GPU 上的高效阐发操做而组织。Arrow 内存格局还撑持零拷贝读取,以便在没有序列化开销的情况下停止闪电式的数据拜候。Arrow 库可用于 C、C++、C#、Go、Java、JavaScript、Julia、MATLAB、Python、R、Ruby 和 Rust。

地址:https://github.com/apache/arrow

17、InterpretML

InterpretML 是一个开源的 Explainable AI(XAI)包,此中包罗了几个更先进的机器进修可解释性手艺。InterpretML 让你训练可解释的 glassbox 模子并解释黑盒系统。InterpretML 可帮忙你领会模子的全局行为,或领会个别预测背后的原因。在它的许多功用中,InterpretML 有一个来自 Microsoft Research 的"glass box"模子,称为 Explainable Boosting Machine,它撑持用黑盒模子的近似值停止 post-hoc 解释的 Lime。

地址:https://github.com/interpretml/interpret

18、Lime

Lime(local interpretable model-agnostic explanations 的简称)是一种 post-hoc 手艺,通过扰动输入的特征并查抄预测成果来解释任何机器进修分类器的预测。Lime 可以解释任何具有两个或更多类的黑盒分类器,其同时适用于文本和图像范畴。Lime 也被包罗在 InterpretML 中。

地址:https://github.com/marcotcr/lime

19、Dask

Dask 是一个用于并行计算的开源库,能够将 Python 包扩展到多台机器上。Dask 能够将数据和计算散布在多个 GPU 上,无论是在统一个系统中仍是在一个多节点集群中。Dask 与 Rapids cuDF、XGBoost 和 Rapids cuML 集成,用于 GPU 加速的数据阐发和机器进修。它还与 NumPy、Pandas 和 Scikit-learn 集成,以并行化其工做流程

地址:https://github.com/dask/dask

20、BlazingSQL

BlazingSQL 是一个基于 RAPIDS 生态系统构建的 GPU 加速 SQL 引擎。RAPIDS 基于 Apache Arrow 柱状内存格局,cuDF 是一个 GPU DataFrame 库,用于加载、毗连、聚合、过滤和操做数据。它是 cuDF 的 SQL 接口,具有撑持大规模数据科学工做流和企业数据集的各类功用。

地址:https://github.com/BlazingDB/blazingsql

21、Rapids

Nvidia 的 Rapids 开源软件库和 API 套件让你有才能完全在 GPU 上施行端到端的数据科学和阐发管道。Rapids 利用 Nvidia CUDA 基元停止底层计算优化,并通过用户友好的 Python 接口表露了 GPU 的并行性和高带宽内存速度。Rapids 依赖于 Apache Arrow 柱状内存格局,包罗 cuDF,一个类似 Pandas 的 DataFrame 库;cuML,一个机器进修库集合,供给 Scikit-learn 中大大都算法的 GPU 版本;以及 cuGraph,一个类似 NetworkX 的加速图阐发库

地址:https://github.com/rapidsai/cudf

22、PostHog

PostHog 是一个为开发人员构建的开源产物阐发平台。主动搜集你网站或应用法式上的每个事务,无需向第三方发送数据。它在用户级别供给基于事务的阐发,捕捉你产物的利用数据以查看哪些用户在你的应用法式中施行了哪些操做。它会主动捕捉点击次数和综合阅读量,以阐发你的用户在做什么,而无需手动推送事务。

地址:https://github.com/PostHog/posthog

23、LakeFS

LakeFS 供给了一种"以办理代码的体例办理你的数据湖"的办法,为对象存储增加了一层类似于 Git 的版本控造。那种对 Git 语义的应用让用户能够创建本身的隔离的、零拷贝的数据分收,在上面工做、尝试和建模阐发,而没有毁坏共享对象的风险。LakeFS 为你的数据带来了有用的 commit notes、元数据字段和 rollback 选项,同时也带来了维护数据完好性和量量的验证 hooks--在一个未提交的分收被不测地合并回消费中之前,运行格局和形式查抄。通过 LakeFS,办理和庇护代码库的熟悉手艺能够扩展到现代数据库,如 Amazon S3 和 Azure Blob 存储。

地址:https://github.com/treeverse/lakeFS

24、Meltano

Meltano 是本年从 GitLab 平分离出来的,一个免费的开源 DataOps 替代传统 ELT(提取、加载、转换)的东西链。Meltano 的数据仓库框架使得为你的项目建模、提取和转换数据变得容易,并通过内置的阐发东西和简化陈述的仪表盘来弥补集成和转换管道。Meltano供给了一个可靠的提取器和加载器库,以及对 Singer 尺度的 data extracting taps 和 data loading targets 的撑持,Meltano 已经是一个数据编排的动力源。

25、Trino

Trino(原名 PrestoSQL)是一个散布式 SQL 阐发引擎,可以对大型散布式数据源运行极快的查询。Trino 允许你同时对数据湖、关系型存储或多个差别来源施行查询,而不需要复造或挪动数据停止处置。并且 Trino 与你的数据科学家可能利用的任何贸易智能和阐发东西共同得很好,无论是交互式的仍是临时性的,更大限度地削减了进修曲线。跟着数据工程师勤奋撑持越来越多的数据源的复杂阐发,Trino 供给了一种优化查询施行和加速差别来源的成果的办法。

地址:https://github.com/trinodb/trino

26、StreamNative

StreamNative 是一个高度可扩展的动静和事务流平台,大大简化了实时陈述和阐发东西以及企业应用流的数据管道铺设。StreamNative 将 Apache Pulsar 强大的散布式流处置架构与 Kubernetes 和混合云撑持等企业额外功用、大型数据毗连器库、简易认证和受权以及用于安康和性能监控的公用东西相连系,既简化了基于 Pulsar 的实时应用法式的开发,又简化了大规模动静传递背板的摆设和办理。

地址:https://github.com/streamnative

27、Hugging Face

Hugging Face 供给了最重要的开源深度进修资本库,它自己并非一个深度进修框架。Hugging Face 的目的是扩展到文本之外,撑持图像、音频、视频、物体检测等。Infoworld 指出,深度进修从业者应在将来几年内亲近存眷那个 repo。

地址:https://github.com/huggingface/transformers

28、EleutherAI

EleutherAI 是一个由机器进修研究人员构成的散布式小组,旨在将 GPT-3 带给所有人。2021 年伊始,EleutherAI 发布了 The Pile,是一个 825 GB 的用于训练的多样化文本数据集;并在 6 月公布了 GPT-J,一个 60 亿参数的模子,大致相当于 OpenAI 的 GPT-3 的 Curie variant。跟着 GPT-NeoX 的呈现,EleutherAI方案将参数不断进步到 1750 亿,以与目前最普遍的 GPT-3 模子合作。

地址:https://github.com/EleutherAI/gpt-neo

29、Colab notebooks for generative art

起首是 OpenAI 的 CLIP(比照语言-图像预训练)模子,一个用于生成文本和图像矢量嵌入的多模态模子。固然 CLIP 是完全开源的,但 OpenAI 的生成性神经收集 DALL-E 却不是。为了填补那一空白,Ryan Murdoch 和 Katherine Crowson 开发了 Colab notebooks, CLIP 与其他开源模子(如 BigGAN 和 VQGAN)连系起来,造做 prompt-based 生成性艺术做品。那些 notebooks 基于 MIT 答应,于过去几十年间在互联网长进行了普遍传布,被从头混合、改动、翻译,并被用来生成了惊人的艺术做品。

地址:https://github.com/openai/CLIP

以上就是 2021 年度 InfoWorld Bossie Awards 项目。此中良多项目我是第一次见,我的开源项目库又多了一些高端、大气、上层次的项目。 开源前哨 日常分享热门、有趣和适用的开源项目。参与维护 10万+ Star 的开源手艺资本库,包罗:Python、Java、C/C++、Go、JS、CSS、Node.js、PHP、.NET 等。

0
回帖

2021 年最佳开源软件出炉,你用过哪些? 相关回复(2)

风之轻语
风之轻语
沙发
20种最佳开源软件中,我特别喜欢其中的代码编辑器 Atom 和数据可视化工具 Tableau,它们都为我的工作带来了极大的便利。
1小时前 (06:58:02)回复00
风起云涌
风起云涌
2楼
我曾使用过许多开源软件,其中一些如Git、Docker和Kubernetes在2019年最佳的名单中。
1小时前 (06:58:06)回复00
取消