<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>InnerVision TechBlog &#187; Z życia spółki</title>
	<atom:link href="http://techblog.innervision.pl/category/z-zycia-spolki/feed/" rel="self" type="application/rss+xml" />
	<link>http://techblog.innervision.pl</link>
	<description>Technologie informacyjne po naszemu</description>
	<lastBuildDate>Tue, 19 Apr 2011 14:03:25 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>Klaster wysokiej niezawodności i awarie</title>
		<link>http://techblog.innervision.pl/2009/10/13/klaster-ha-a-awarie/</link>
		<comments>http://techblog.innervision.pl/2009/10/13/klaster-ha-a-awarie/#comments</comments>
		<pubDate>Tue, 13 Oct 2009 12:04:42 +0000</pubDate>
		<dc:creator>Piotr Rybicki</dc:creator>
				<category><![CDATA[Z życia spółki]]></category>
		<category><![CDATA[klastry]]></category>
		<category><![CDATA[na wesoło]]></category>
		<category><![CDATA[seagate]]></category>

		<guid isPermaLink="false">http://techblog.innervision.pl/?p=7</guid>
		<description><![CDATA[Dzień w pracy jak co dzień. Poranna kawa, lektura wybranych kolumn rzepy, wymiana poglądów techniczno-politycznych z kolegami. Nagle na monitorze dostępności systemów pojawiają się informacje w kolorze czerwonym. Chwilę później SMS&#8217;y sypią się jednocześnie, chyba z 10 sztuk. Przestał odpowiadać serwer klienta. Ale chwila, czy teraz przypadkiem nie idzie kampania? Zaczyna być coraz ciekawiej. Jeszcze [...]]]></description>
			<content:encoded><![CDATA[<p><img class="size-thumbnail wp-image-6 alignleft" title="awaria klastra" src="http://techblog.innervision.pl/wp-content/uploads/2009/10/awaria_klaster-150x150.png" alt="Awaria klastra" width="150" height="150" /></p>
<div id="NewsPostDetailContent">
<p>Dzień w pracy jak co dzień. Poranna kawa, lektura wybranych kolumn rzepy, wymiana poglądów techniczno-politycznych z kolegami.</p>
<p>Nagle na monitorze dostępności systemów pojawiają się informacje w kolorze czerwonym. Chwilę później SMS&#8217;y sypią się jednocześnie, chyba z 10 sztuk. Przestał odpowiadać serwer klienta. Ale chwila, czy teraz przypadkiem nie idzie kampania? Zaczyna być coraz ciekawiej.</p>
<p>Jeszcze chwila i wszyscy wpadną w panikę. Jednak tak się nie dzieje &#8211; w systemie widać, że klient ma przecież klaster wysokiej dostępności. Sprawdzamy na monitorze stan usług &#8211; wszystkie funkcjonują nadal, tylko że teraz z jednego serwera a nie z obu. Ciągłość świadczenia usług jest zachowana.</p>
<p>Podłączamy się do zdalnej konsoli, aby zobaczyć na ekranie ostatnie komunikaty z systemu operacyjnego na uszkodzonym serwerze. System uznał, że wszystkie dyski zniknęły. Wszystkie 4 jednocześnie? Co tam się dzieje?</p>
<p>Restart maszyny, teraz już system nie widzi dysków. Nie ma rady, jedna grupa techników idzie zobaczyć co się dzieje. Okazuje się, iż faktycznie wszystkie dyski padły. Wydaje się to nieprawdopodobne, jednak jak się jeszcze później okazuje, firma Seagate zrobiła <a href="http://www.wykop.pl/link/131089/uwaga-masz-dysk-seagate-7200-11-masz-problem" target="_blank">psikusa</a> wypuszczając serię dysków z uszkodzonym firmware. Objawy, modele i wersje firmware dysków &#8211; wszystko niestety się zgadza.</p>
<p>Management bogatszy o tą wiedzę, powiadamia klienta o sytuacji. &#8222;Szanowni Państwo, macie teraz awarię jednego ze swoich serwerów&#8221;. Daje się wyczuć niepokój w rozmówcy. &#8222;Tak, wiem, że idzie teraz kampania &#8211; dzięki klastrowi, wszystko nadal działa&#8221; &#8211; uspokajamy, po czym wyjaśniamy co się stało z dyskami. Po wysłaniu mailem parametrów dysków, nie mijają 2 godziny jak otrzymujemy nowe dyski, już od innego producenta.</p>
<p>Pod koniec dnia roboczego, serwer jest już wyposażony w nowe dyski, dane są odzyskane z backupu, a klastrowe urządzenia blokowe &#8211; zsynchronizowane. Podejmujemy decyzję o rozłożeniu usług w klastrze na 2 serwery &#8211; tak jak miało to miejsce przed awarią.</p>
<p>Lepiej nie myśleć co byłoby, gdyby nie klaster&#8230;</p>
</div>
]]></content:encoded>
			<wfw:commentRss>http://techblog.innervision.pl/2009/10/13/klaster-ha-a-awarie/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

