大师网-带你快速走向大师之路 解决你在学习过程中的疑惑,带你快速进入大师之门。节省时间,提升效率

故障

故障是系统不能执行规定功能的状态。通常而言,故障是指系统中部分元器件功能失效而导致整个系统功能恶化的事件。

数据库学习笔记——22 管理事务处理

DELETE FROM ordertotals; 每个保留点都取标识它的唯一名字,以便在回退时,MySQL知道要回退到何处。为了回退到本例给出的保留点,可如下进行: ROLLBACK TO delete1; autocommit 标志决定是否自动提交更改,不管有没有 COMMIT语句。设置 autocommit 为 0 (假)指示MySQL不自动提交更改(直到 autocommit 被设置为真为止)。 标志为连接专用 autocommit 标志是针对每个连接而不是服务器的。

如何实现一个TCC分布式事务框架的一点思考

如何实现一个TCC分布式事务框架的一点思考 本文将以Spring容器为例,试图分析一下,实现一个通用的TCC分布式事务框架需要注意的一些问题。 一、TCC全局事务必须基于RM本地事务来实现全局事务 TCC服务是由Try/Confirm/Cancel业务构成的, 其Try/Confirm/Cancel业务在执行时,会访问资源管理器(Resource Manager,下文简称RM)来存取数据。这些存取操作,必须要参与RM本地事务,以使其更

巧用机器学习定位云服务器故障

巧用机器学习定位云服务器故障 欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由roganhuang 发表于云+社区专栏 导语 随着腾讯云业务的扩大,母机数量越来越多。为减少人力并实现母机故障的自动化定位,本文尝试利用机器学习算法,通过对历史故障母机的日志数据学习,训练模型实现自动化分析定位母机故障原因。 背景 对于每一单母机故障我们都需要

Redis架构与Redis-cluster

// Jedis连接池配置 JedisPoolConfig jedisPoolConfig = new JedisPoolConfig(); } } 运行的结果如下图所示: 可以看到,经过改写的redisClusterConnection的确能读取到redis-cluster的数据。但这一个数据我们还需要验证一下到底是不是通过slave读取到的,又或者还是通过slave重定向给master才获取到的? 带着疑问,我们可以开通debug模式,在redisClusterConnection.sync().

故障硬盘点灯操作

故障硬盘点灯操作 按照常理说,硬盘故障了,会自动亮红灯,故障消除后会自动恢复正常,这个本来是服务器自带的功能。但现实情况往往不是这样,即使硬盘故障了,现场通过外观也看不出来。 1 硬盘点灯的意义 在运维的工作中,很大也是很重要的一项工作就是故障处理,而故障处理中以硬盘故障最为常见。如果更换错误,可能会造成数据丢失,后果很严重。那么如何能

微服务架构的故障隔离及容错处理机制

微服务架构的故障隔离及容错处理机制 本文首先介绍微服务架构存在的风险,然后针对如何避免微服务架构的故障,提出了多种有效的微服务架构中的方法和技术,其中例如服务降级、变更管理、健康检查和修复、断路器、限流器等。 目录 1、微服务架构的风险 2、优雅的服务降级 3、变更管理 4、健康检查和负载均衡 5、自我修复 6、故障转移缓存(Failover Caching) 7、重试逻

如何搭建高可用redis架构?

如何搭建高可用redis架构? 1 题记 Redis 是一个开源的使用 ANSI C 语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库,并提供多种语言的 API。 如今,互联网业务的数据正以更快的速度在增长,数据类型越来越丰富,这对数据处理的速度和能力提出了更高要求。Redis 是一种开源的内存非关系型数据库,给开发人员带来的体验是颠覆性的。在自始至终的设计过

深入剖析Redis - Redis集群模式搭建与原理详解

深入剖析Redis - Redis集群模式搭建与原理详解 1. Redis集群方案 Redis Cluster 集群模式通常具有高可用、可扩展性、分布式、容错等特性。Redis 分布式方案一般有两种: 1.1 客户端分区方案 客户端就已经决定数据会被存储到哪个 redis 节点或者从哪个 redis 节点读取数据。其主要思想是采用哈希算法将 Redis 数据的 key 进行散列,通过 hash 函数,特定的 key会映射到特定的 Redis 节点上。

redis源码分析(七):集群--哨兵模式

// 执行定期操作 // 比如 PING 实例、分析主服务器和从服务器的 INFO 命令 // 向其他监视相同主服务器的 sentinel 发送问候信息 // 并接收其他 sentinel 发来的问候信息 // 执行故障转移操作,等等 sentinelHandleDictOfRedisInstances(sentinel.masters); // 运行等待执行的脚本 sentinelRunPendingScripts();

DevOps 和 SRE

- YouTube 原文链接: DevOps 和 SRE - Log4D 欢迎关注我的微信公众号:窥豹 窥豹 如果对你有帮助,给作者 ¥2 买张彩票吧。 3a1ff193cee606bd1e2ea554a16353e

Java后台基础设施

Java后台基础设施 使用Java后端技术的目的就是构建业务应用,为用户提供在线或者离线服务。因此,一个业务应用需要哪些技术、依赖哪些基础设施就决定了需要掌握的后端技术有哪些。纵观整个互联网技术体系再结合公司的目前状况,笔者认为必不可少或者非常关键的后端基础技术/设施如下图所示: 这里的后端基础设施主要指的是应用在线上稳定运行需要依赖的关键组件

Haproxy+Keepalived高可用

Haproxy+Keepalived高可用 负载均衡技术 软件负载均衡一般通过两种方式来实现:基于操作系统的软负载实现和基于第三方应用的软负载实现。LVS就是基于Linux操作系统实现的一种软负载,HAProxy就是开源的并且基于第三应用实现的软负载。HAProxy相比LVS的使用要简单很多,功能方面也很丰富。当前,HAProxy支持两种主要的代理模式:"tcp"也即4层(大多用于邮件服务器、内部协议通信服

Redis实践之复制的原理与优化

Redis实践之复制的原理与优化 0 大纲 1 简介 2 复制的配置 异步执行,很耗时间 4 操作 6 全量复制 run-id 7 全量复制开销 8 自动故障转移

搭建Keepalived + Nginx + Tomcat的高可用负载均衡架构

} #http服务器配置 http { include mime.types; #upstream负载均衡配置,配置路由到tomcat的服务地址以及权重 upstream localhost{ server 192.168.10.11:8080 weight=2; location = /50x.html { root html; } } } 5.2 主Keepalived配置 (1)修改11服务器的keepalived配置文件,vi /etc/keepalived/keepalived.conf (2)内容如下: !then $NGINX -s stop #这里再次尝试启动NG $NGINX sleep 5 nmap localhost -p $PORT | grep "$PORT/tcp open" [ $?

智能运维(AIOps)中几处问题的解决方案与思路

智能运维(AIOps)中几处问题的解决方案与思路 上一篇文章中我们介绍了智能运维的定义和发展现状,但是智能运维需要解决的问题还有很多:海量数据存储、分析、处理,多维度,多数据源,信息过载,复杂业务模型下的故障定位。本文针对每一类问题给出了经过实践证明的解决方案和思路,同时说明为什么要这么做,以及在工程和算法上会遇到的问题。 1 海量数据的存储

为什么架构设计要进行服务隔离!

为什么架构设计要进行服务隔离! 我们在做系统架构设计的时候,经常离不开的一个话题就是进行服务的隔离设计。 那什么是「服务隔离」呢? 顾名思义,它是指将系统按照一定的原则划分为若干个服务模块,各个模块之间相对独立,无强依赖。当有故障发生时,能将问题和影响隔离在某个模块内部,而不扩散风险,不波及其它模块,不影响整体的系统服务。 其实隔离设计

Eureka Server

/** * * 功能描述: * * @version 2.0.0 * @author zhiminchen */ @SpringBootApplication @EnableEurekaServer public class App { public static void main(String[] args) { new SpringApplicationBuilder(App.class).

专访阿里数据库备份专家 教你pick最有效的备份系统

专访阿里数据库备份专家 教你pick最有效的备份系统 数据库备份是个老生常谈的话题,看似很简单,但在实际操作过程中,运维人员往往会遇到这样或那样的坑。 那么,如今的数据库备份有哪些挑战?如何构建有效备份系统?有什么解决办法?日前,小编就这些问题采访了阿里数据库备份专家衡铁刚(佩恩)。 阿里数据库备份专家衡铁刚(佩恩) 先问个小白问题:数据库为