Posts in 2023
  • v2.1:向量+PG全系支持!

    2023年06月09日 in 版本发布

    Featured Image for v2.1:向量+PG全系支持!

    随着 PostgreSQL 夏季小版本例行更新,与 16 Beta 的发布,Pigsty 也紧随PG社区发布了 v2.1 版本,这次更新支持了 16 Beta1 的高可用与新监控指标,也提供了 PG 12 - 15 版本的支持。同时,AI 向量扩展插件 PGVector 也于 2.0.2 正式进入 Pigsty 中并默认启用。 https://github.com/Vonng/pigsty/releases/tag/v2.1.0 向量数据库扩展 PGVector 最近向量数据库非常火爆,市面上有 …

    Read more

  • 数据库老司机:合订本

    2023年05月29日 in 数据库

    Featured Image for 数据库老司机:合订本

    最近在技术圈有一些热议的话题,云数据库是不是智商税??公有云是不是杀猪盘?分布式数据库是不是伪需求?微服务是不是蠢主意?你还需要运维和DBA吗?中台是不是一场彻头彻尾的自欺欺人?在Twitter与HackerNews上也有大量关于这类话题的讨论与争辩。 在这些议题的背后的脉络是大环境的改变:降本增效压倒其他一切,成为绝对的主旋律。开发者体验,架构可演化性,研发效率这些属性依然重要,但在 ROI 面前都要让路 —— 社会思潮与根本价值观的变化会触发所有技术的重新估值。 有人说,互联网公司砍掉一半人 …

    Read more

  • 数据库需求层次金字塔

    2023年05月10日 in 数据库

    Featured Image for 数据库需求层次金字塔

    与马斯洛需求金字塔类似,用户对于数据库的需求也有着一个递进的层次。用户对于数据库的需求从下往上可以分为八个层次,分别与人的八个需求层次相对应: 生理需求,功能:内核/正确性/ACID 安全需求,安全:备份/保密/完整/可用 归属需求,可靠:高可用/监控/告警 尊重需求,ROI:性能/成本/复杂度 认知需求,洞察:可观测性/数字化/可视化 审美需求,掌控:可控制性/易用性/IaC 自我实现,智能:标准化/产品化/智能化 超越需求,变革:真·自治数据库 安全需求与生理需求同属基础需求,一个用于生产环 …

    Read more

  • AI大模型与向量库 PGVector

    2023年05月10日 in PG 开发

    Featured Image for AI大模型与向量库 PGVector

    新 AI 应用在过去一年中出现了指数爆炸的增长态势,而这些应用面临的一个共同挑战是如何大规模地存储与查询以向量表示的 AI Embedding。本文聚焦被 AI 炒火了的向量数据库,介绍了AI嵌入与向量存储检索的基本原理,并用一个具体的知识库检索案例来串联介绍向量数据库插件 PGVECTOR 的功能、性能、获取与应用。 AI是怎么工作的 GPT 展现出来了强大的智能水平,它的成功有很多因素,但在工程上关键的一步是:神经网络与大语言模型将一个语言问题转化为数学问题,并使用工程手段高效解决了这个数学 …

    Read more

  • 微服务是不是个蠢主意?

    2023年05月07日 in 数据库

    Featured Image for 微服务是不是个蠢主意?

    亚马逊的Prime Video团队发表了一篇非常引人注目的案例研究[2] ,讲述了他们为什么放弃了微服务与Serverless架构而改用单体架构。这一举措让他们在运营成本上节省了惊人的 90%,还简化了系统复杂度,堪称一个巨大的胜利。 但除了赞扬他们的明智之举之外,我认为这里还有一个重要洞察适用于我们整个行业: “我们最初设计的解决方案是:使用Serverless组件的分布式系统架构… 理论上这个架构可以让我们独立伸缩扩展每个服务组件。然而,我们使用某些组件的方式导致我们在大约5%的预期负载时, …

    Read more

  • 分布式数据库是不是伪需求?

    2023年05月07日 in 数据库

    Featured Image for 分布式数据库是不是伪需求?

    随着硬件技术的进步,单机数据库的容量和性能已达到了前所未有的高度。而分布式(TP)数据库在这种变革面前极为无力,和“数据中台”一样穿着皇帝的新衣,处于自欺欺人的状态里。 太长不看 互联网的牵引 分布式的权衡 新硬件的冲击 伪需求的困境 迷茫下的挣扎 Reference 太长不看 分布式数据库的核心权衡是:“以质换量”,牺牲功能、性能、复杂度、可靠性,换取更大的数据容量与请求吞吐量。但分久必合,硬件变革让集中式数据库的容量与吞吐达到一个全新高度,使分布式(TP)数据库失去了存在意义。 以 NVMe …

    Read more

  • 云盘是不是杀猪盘?

    2023年03月15日 in 云计算

    Featured Image for 云盘是不是杀猪盘?

    我们已经用数据回答了《云数据库是不是智商税》这个问题,但在公有云块存储的百倍溢价杀猪比率前,云数据库只能说还差点意思。本文用实际数据揭示公有云真正的商业模式 —— 廉价EC2/S3获客,EBS/RDS杀猪。而这样的做法,也让公有云与其初心愿景渐行渐远。 TLDR:太长不看 WHAT:真正的杀猪盘 WHY:为什么要这样定价 HOW:还原杀猪盘内幕 被遗忘的初心愿景 博弈将走向何方? TL;DR 太长不看 EC2 / S3 / EBS 是所有云服务的定价之锚。如果说 EC2/S3 定价还勉强能算合 …

    Read more

  • 垃圾腾讯云CDN:从入门到放弃?

    2023年03月08日 in 云计算

    Featured Image for 垃圾腾讯云CDN:从入门到放弃?

    我和 瑞典马工虽然在 云数据库 VS DBA 这个议题上针锋相对,但在一点上能达成共识:至少国内的公有云厂商做的是真垃圾。用马工的话来说就是:“阿里云是个工程质量差劲的正经云,但腾讯云是一群业余销售加业务码农玩游戏”。 前因后果 我有个软件托管在 GitHub 上,提供了 1MB 的源码包和 1GB 的离线软件包下载。大陆用户因为 在境内 没法从 GitHub 下载,因此需要有一个境内的下载地址,于是我就用了腾讯云的 COS(对象存储) 与 CDN(内容分发网络)服务。 用 CDN 的初衷不外 …

    Read more

  • 驳《再论为什么你不应该招DBA》

    2023年03月01日 in 云计算

    Featured Image for 驳《再论为什么你不应该招DBA》

    郭德纲有一段相声:比如我和火箭专家说,你那火箭不行,燃料不好,我认为得烧柴,最好是烧煤,煤还得精选煤,水洗煤不行。如果那科学家拿正眼看我一眼,那他就输了。 但不管怎么说,马工也还是一位体面的瑞典研发工程师。没有做过DBA就敢大放厥词,开地图炮拉仇恨,实在勇气可嘉。之前在《你怎么还在招聘DBA》,以及回应文《云数据库是不是智商税》中,我们便已交锋过。 当别人把屎盆子扣在这个行业所有人头上时,还是需要人来站出来说几句的。因此今天特此撰文以驳斥马工的谬论:《再论为什么你不应该招DBA》。 马工的论点 …

    Read more

  • v2.0:开源RDS PG替代

    2023年02月26日 in 版本发布

    Featured Image for v2.0:开源RDS PG替代

    2023/02/28,Pigsty v2.0.0 正式发布,带来了一系列重大的功能更新。 现在 PIGSTY 是 “PostgreSQL In Great STYle"的首字母缩写,即”全盛状态的 PostgreSQL"。而 Pigsty 的定位也不再是 “开箱即用的PostgreSQL数据库发行版”,变成了 “Me Better 开源 RDS PG 替代”。 明人不说暗话,这是一个很有野心的目标:推翻云数据库垄断,砸烂****RDS的饭碗!详见:《云 …

    Read more