Tivoli developerWorks

Archive for January, 2010

ITM Situation 的性能和最佳实践

01.27.2010 · Posted in 服务可用性和性能管理

如果假定Agent没有bug,那么它在运行时的CPU和内存占用通常应该很低,对资源的消耗主要来自两个方面,一个是Situation验证,另一个就是Sampling。其中Situation是ITM告警中一个比较重要的环节,毕竟Sampling能调优的范围不多,Situation的策略将直接影响ITM的整体性能,ITM61的Situation在服务端验证,从ITM62之后,绝大部分Situation挪到了Agent端验证,这对验证的性能有非常大的提升,对TEMS也是很大的解放。即便如此,对Situation的编写,也要注意很多地方: 尽量不必要使用Group Function,也就是MIN, MAX, AVG, SUM, COUNT,这种函数。原因是这样,当配置了这些函数,那么Agent无法在采集的那一刹那,判断出是否满足Situatoin的公式条件,只能把数据传递给TEMS,在一个缺省的时间段内,把Agent连续传过来的值做平均,然后判断是否告警。这样效率肯定是很低,首先Agent自身不能验证Situatoin,一旦把验证的任务交给TEMS,那么对性能就是极大的伤害,而且低效。这里,绕行的方法很多,比如可以采集一些平均值(比如AIX OS中有些指标本省就是平均值,就利用之,不要用瞬时值,依靠ITM来做运算),或者,用连续多次,超过阀值,来告警,以避免偶尔阀值超越产生的无告警。 把最严格的Situation限制条件放到第一个,这个应该比较好理解,这样能让验证的数据量尽快的降到最小。比如,Situation有3个条件,采集的数据有100 rows,那么第一个条件导致满足的只有10条,那么后两个条件,只用面对这10条做验证了。 为重要的系统建立单独的managed System,这样能尽量的让其他的Situation减少对重要系统的干扰,在Situation tuning中可以有针对性的tuning。 尽量不要使用太短的sample interval,一旦告警的验证周期,不足以确保采集,那么必然会导致数据丢失或者告警延时。比如,很多客户轮询SOAP,N个系统,几百个SOAP,轮询下来10分钟,但是告警周期是8分钟,那么就会出这个问题。 尽量减少大数据量属性组的Situation,有的属性组返回数据量极大,最常见的就是有的系统进程数几百个,或者磁盘mount的几百块,比如Situation要检查某个进程的CPU消耗,要把所有的进程信息都获取到,然后做判断,这种情况内存,CPU,消耗都很大。需要提一下的是,从ITM622开始,进程的missing function在Agent端验证了,以前实在TEMS上。 如果需要到TEMS验证的Situation,可以考虑分散到不同RTEMS,某些情况,我们不得不考虑在Server上验证Situation,包括前面的AVG,MIN,等函数,还包括一些关联Situation,比如A发生,同时B也发生了,才告警,牵扯到不同的属性组等等,都需要到TEMS验证,这时候,考虑到压力分担道不同的RTEMS。 不需要的Situation不要启动,缺省系统有些Situation自启动的,在生产环境中,这些都要仔细检查,没用的都不要启。 ...

ITCAM for WR 各 Workspace 数据来源

01.21.2010 · Posted in 服务可用性和性能管理

由于WebSphere是诸多容器(数据库,J2EE容器,消息中间件,应用程序,等等)中用的最广的一个Agent,这个问题关心的人很多,因此大致总结一下: 需要了解采集数据的机制,基本上目的两方面: 出了问题,知道从哪去找根源 从采集方式上可以大致判断Agent对J2EE容器性能的影响 ITCAM for WR的TEP上有四类数据: Resource data:数据来源PMI Request data:数据来源DC Data from WebSphere log files:数据来源WAS系统日志,SystemOut.log,gclog,DC mesg event 进程信息,比如WAS进程CPU使用率 :来源OS API。 Resource Data相关Worspace: Web Applications Web Applications : Servlets/JSPs Web Applications : Sessions EJB Containers EJB Containers : Enterprise Java Beans EJB Containers : Container Transactions EJB Containers : Container Object Pools DB Connection Pools J2C Connection Pools Thread Pools Cache Analysis : Dynamic Cache Cache Analysis : Dynamic Cache Templates Workload Management : Workload Management Server Workload ...

ITCAM for WAS DC/TEMA对J2EE容器的影响

01.18.2010 · Posted in 服务可用性和性能管理

覆盖范围 性能测试所涉及到的组件包括:TEMS,TEPS,TEMA/DC,覆盖的组建将阐述ITCAM for WAS 测试环境 本次是在US实验室的测试结果 DC端的环境是,AIX 5.3, WAS 6.1.0.21 压力测试工具是AKStress 测试应用是IBM WAS Trade 6.1 DC的采集级别是L1或者L2,2%的采样率入库 性能数据通过nmon analyzer来收集 在windows上通过perfmon来收集性能数据 TEMS,TEPS 2-way 3.4 GHz Intel Xeon CPU  4 GB RAM 1Gbps network Disk Capacity – 36 GB Red Hat Enterprise Linux AS release 4 (Nahant Update 3) Linux romeo4s5 2.6.9-34.ELsmp #1 SMP i686 i686 i386 GNU/Linux (32-bit) DB2 8.1.7 (FP 14) IBM Tivoli Monitoring 6.21 Management Server 2-way 3.4 GHz Intel Xeon CPU  4 GB RAM 1Gbps network Disk ...

ITCAM for WAS/J2EE和ITCAM for Web Resource的区别

01.13.2010 · Posted in 服务可用性和性能管理

这个问题让很多人晕,其原因相当复杂,先描述一下背景,然后再说什么情况下用什么。 2004年底,IBM收购了Cyanea公司,其中包含了对WAS监控的产品叫WSAM(WebSphere Application Monitoring),后来被重命名为ITCAM for WebSphere,并入到IBM Tivoli 服务可用性性能管理旗下(Service Availability Performance Management旗下)。后来支持的J2EE中间件扩展到Weblogic,JBoss和Tomcat,这一部分非WAS家族的监控归到另一个产品名下:ITCAM for J2EE。因此,ITCAM for J2EE的功能和ITCAM for WAS完全相同,只是不同的Product ID。 2005年IBM并购了Candle,也是做监控的,监控的范围更广。为了整合,必定牺牲一个框架,显然Candle的框架更加全面而灵活,可扩展性更好(以前叫Omegamon,也就是后来的ITM6,主机部分保留了Omegamon这个名字,但框架服务端和开放平台无异),因此其他的框架慢慢凋亡,都归并到ITM框架下,所谓的框架就是,呈现,配置,历史数据,采集格式都统一使用ITM的,其他的产品只留Agent端。 直到到2008年,除开ITCAM for WAS,其他的产品都已经顺利的被纳入到ITM框架,实现了统一。但ITCAM for WAS的功能大部分核心无法被整合到ITM框架下,只有很局部的功能可以在ITM下实现(这一部分就是ITCAM for Web Resoure),原因是ITCAM for WAS很多强大的功能,ITM框架并不提供,是技术上的局限性,因此,导致了2,3年内ITCAM for WAS 和 ITCAM for WR长期共存。由于WAS市场的庞大,和对ITCAM for WAS的需求强烈,因此无法舍弃以前的产品,因此ITCAM for WAS成为唯一一块没有被ITM收复的领土。 2009年底,ITM框架强行把ITCAM for WAS植入,其原因是ITM从62版本后,服务端内嵌的WAS(eWAS),这样ITM框架就一定程度上具备的吸纳ITCAM for WAS的Server端的能力,但还是差很远,因此集成的节目可以让人清晰的感觉出这里两个不同的产品的强行揉和。 2010年,对于J2EE的监控,IBM把ITCAM for WR,ITCAM for WAS,ITCAM for J2EE三个产品糅合到一起,取了新名字:ITCAM for Application Diagnostics。从此,至少在名字上,对J2EE的监控统一了。而ITCAM for WR在2007年被归并到ITCAM for Applications Bundle之后,ITCAM for ...

IBM 云计算相关资料

01.11.2010 · Posted in 动态基础架构和云计算

ZT FROM ZHUAXIA 解决方案 动态架构白皮书(2.45MB) 智慧的地球 – IBM 云计算 2.0(1.01MB) 智慧地球–动态架构之业务弹性方案建议书(550KB) 智慧地球–动态架构之信息基础架构(458KB) IBM 智慧媒体存储系统解决方案资料(2.17MB) 信息保留方案群组(3.55MB) 信息安全方案群组(4.22MB) 信息高可用方案群组(5.01MB) IBM DS8000 系统存储方案建议书(2.04MB) DS8000 存储容灾解决方案建议书(291KB) 法规遵从方案群组(1.97MB) 企业级重复数据删除方案建议书(550KB) 产品手册 动态架构企业级存储 DS8700 之新特性(184KB) 动态架构企业级存储 DS8700 之数据安全(109KB) IBM System x 产品家族技术资料(935KB) IBM System x3850M2(1.17MB) IBM System x3950M2(817KB) 《IBM Blade Center 解决方案》(818KB) 《IBM Blade Center 产品手册》(2.44MB) IBM System Storage DS5000 资料(1.7MB) IBM Power 570 资料(505KB) IBM Power 520 资料(1.8MB) 方案建议书 IBM 动态架构 – Power 服务器业务连续性方案建议书(647KB) IBM DS5000 系列存储系统方案建议书(289KB) Power 服务器虚拟化方案建议书(647KB) SVC 存储虚拟化方案建议书(966KB) System x 虚拟化平台方案建议书(524KB) 成功案例 Power 成功案例(1.84MB) ...