东岳网络工作室团队博客
分享我们所得
-
How Elasticsearch uses Lucene index time join to handle nested objects
Elasticsearch’s nested type uses Lucene’s index time join to filter on nested objects to avoid invalid result from flattening.
at15 -
同去网停机维护通知
同去网将于 2019 年 10 月 26 日晚 19:00 至 24:00 停机维护
hebingchang -
利用 kubebuilder 优化 Kubernetes Operator 开发体验
Kubernetes 现在已经成为了容器集群管理,乃至云计算的事实标准。相比于它曾经的竞争对手如 Mesos,Docker Swarm 等,其最大的优势在于扩展性。其扩展性的一个重要的体现,就是 Custom Resource 这一特性。Kubernetes 本身有很多资源类型,被我们熟知的有 Pod,Job,Deployment 等等。而通过 Custom Resource,用户可以定义自己的资源,并实现对应的 Operator(控制器)来处理对资源的请求。用户实现的 Operator 通过与 Kubernetes 的 API server 交互,来实现自身的业务逻辑。
gaocegege -
当我们在谈论机器学习平台时,我们在谈论什么
机器学习平台对于不同的工程师角色而言,有着不同的意涵。随着之前几篇关于 Kubeflow 的文章发布后,有不少的网友私下询问到底什么是机器学习平台,它与机器学习框架有何不同等问题。这篇文章希望能够从不同的维度来介绍一下,我们一直谈论的机器学习平台,到底是什么。
gaocegege -
机器学习平台漫谈
随着深度学习的兴起,机器学习在最近几年以星火燎原之势席卷了整个科技行业。而在整个机器学习的工作流中,模型训练的代码只是其中的一小部分。除此之外,训练任务的监控,日志的回收,超参数的选择与优化,模型的发布与集成,数据清洗,特征提取等等,都是流程中不可或缺的部分。因此,有一些工具和公司的产品,致力于为机器学习从业者提供一个统一的平台,帮助用户更好地完成其机器学习业务的落地。这篇文章是关于机器学习平台产品的分析对比,由于利益相关性只放出国外的产品,如有遗漏或错误还请指出。
gaocegege -
Kubernetes CRD Operator 实现指南
8012 年了,Kubernetes 已经成为了集群调度领域最炙手可热的开源项目之一。而多工作负载支持,是讨论到集群调度时不得不谈的一个话题。CRD 是 Kubernetes 的一个特性,通过它,集群可以支持自定义的资源类型,这是在 Kubernetes 集群上支持多工作负载的方式之一。本文希望讨论在实现一个 Kubernetes CRD Operator 时可能遇到的问题以及解决方案,抛砖引玉,探索实现的最佳实践。文章其余部分如下安排:首先在“导论”中,讨论了多工作负载的意义以及不同架构的调度系统的支持方式。其次在“预热”一节详细介绍了在 Kubernetes 上对多工作负载的不同支持方案,进一步划定本文的讨论范围。最后在“正文”一节介绍实现 CRD Operator 的注意事项。本文主要内容来自笔者在实现 kubeflow/tf-operator 时的经验教训。
gaocegege -
Google Summer of Code, A Mentor's Perspective
这篇文章的受众是想更加深入了解 Google Summer of Code 这一活动,或者有志于担任某一开源社区 mentor 的同学。由于有些背景知识没有介绍,因此配合 Google Summer of Code 学生申请指南阅读更佳。
gaocegege -
Katib: Kubernetes Native 的超参数训练系统
这篇文章主要介绍了 Katib,一个由 NTT 贡献到 Kubeflow 社区的超参数训练系统。面向人群为对在 Kubernetes 上运行机器学习负载感兴趣的同学。
gaocegege -
Kubeflow 安利:在 Kubernetes 上进行机器学习
这篇文章主要介绍了 Kubeflow 的使用,以及未来的计划,面向人群为对在 Kubernetes 上运行机器学习负载感兴趣的同学。
gaocegege -
Case Study: 使用 Netlify 持续集成你的静态网站
这篇文章主要介绍了 Netlify, 一个可以用来做静态网站的持续集成与持续部署的工具. 通过 Netlify, 用户可以非常简单地为其静态网站项目引入持续集成, 并且允许其他成员对静态网站进行 UI 层面的 review.
gaocegege -
小议分布式系统的一致性模型
一致性 (Consistency) 一直是分布式系统里一个很重要的话题, 如果要了解一致性, 要从系统模式开始说起.
gaocegege -
Go: tasks repeated at intervals
Use Go to run tasks at intervals.
codeworm96 -
Go Hack 17 参赛日记
2017 年 10 月 21 日,由 Golang Foundation 和 PingCAP 联合举办的 Go Hack 17 在上海心动网络举行,东岳的小哥哥 @gaocegege 和 @codeworm96,以及工作一年的的 Go 工程师 @hawkingrei 一起组成了队伍 ,参加了这次 hackathon,凭借 killy: Play TiDB in Minecraft! 取得了二等奖以及 PingCAP 赞助的专项奖。这篇文章是 @gaocegege 第一人称视角的 hackathon 记录。
gaocegege -
浅入了解容器编排框架调度器之 Kubernetes
Kubernetes 是由 Google 捐赠给 CNCF 的一个容器编排框架,也是目前应用最为广泛的编排框架之一。这篇文章是对 Kubernetes 1.8 中的 Scheduler(以下称为 kube-scheduler)的介绍,如果要阅读本文,需要对 Kubernetes 的基本概念如 pod, node 等有所了解。
gaocegege -
安利时间: Processing + R = ?
Processing.R 是我在 Jeremy Douglass 指导下,为 Processing 实现的一个 R 语言模式,这是一个 Google Summer of Code 2017 项目。这篇文章会讲一讲它的应用,以及实现。
gaocegege -
Unikernel: 从不入门到入门
Unikernels: Beyond Containers to the Next Generation of Cloud 是 Russ Pavlicek 的一本动物书(虽然是 O’Reilly 的,但是封面不是动物,是石榴),这本书对 Unikernel 有着比较全面的介绍,而且电子书是免费的,值得一读。
gaocegege -
Google Summer of Code 申请指南
本文的受众主要是想在暑假找点事情做,挣点外快的同学,亦或是想积累一下参与真实软件开发经验的同学。
gaocegege -
时间序列数据库漫谈
时间序列数据库基本概念和热点话题
at15 -
Introduction to Time Series Database
An introduction to time series database basic concepts and hot topics
at15 -
Google SRE 阅读笔记(1)-监控
SRE,全称是 Site Reilability Engineer,是一个类似于运维,但是跟传统运维不一样的职业,更加偏向于 DevOps。谷歌在 SRE-谷歌运维解密 一书中分享了 SRE 的工作职责,以及谷歌在自己的运维工作中的一些经验。
gaocegege