שאלה התאונה הטובה ביותר של מנהל המערכת [סגור]


אני מחפש סיפורים משעשע של תאונות מנהל המערכת היה לך. מחיקת הודעת הדוא"ל של המנכ"ל, עיצוב הכונן הקשיח הלא נכון וכו '.

אני אוסיף את הסיפור שלי כתשובה.


87
2018-05-13 21:00




ראה גם serverfault.com/questions/5066 - Zoredache
זה באמת יותר סקר אז שאלה. זה כנראה צריך להיות מוגדר ויקי הקהילה. - Zoredache
כן, זה בהחלט צריך להיות קהילה ויקי. כוונת השאלה, עם זאת, הסיפור האהוב עלי הוא מייל 500 מייל אחד - ibiblio.org/harris/500milemail.html - אם כי, כמובן, זה לא היה לי. - Mihai Limbăşan
500miles הוא פשוט נפלא - Hubert Kario
זה צריך להיקרא "גרוע יותר תאונה מנהל המערכת." - Rilindo


תשובות:


היה לי כיף לגלות את ההבדל בין לינוקס "killall" הפקודה (הורג את כל התהליכים התואמים את השם שצוין, שימושי עבור עצירת זומבים) ואת הפקודה "Solarall" סולאריס (הורג את כל התהליכים ומעצור את המערכת, שימושי עבור עצירת שרת הייצור ב באמצע שעות השיא וקבלת כל עמיתים לעבודה לצחוק עליך במשך שבוע).


133
2018-05-13 23:20



הייתי שם עשיתי את זה. אנחנו aliased הפקודה- killall על תיבות Solaris לאחר מכן: כינוי killall = 'הד ORLLY?' 49 - Commander Keen
יש גם הבדל חשוב ב- Solaris בין 'ifconfig-a4' (הצג את כל ממשקי ה- IPv4 של הממשקים) ו- 'ifconfig-a 4' (הגדר את כל הממשקים ל -0.0.0.4). - Zanchey
+1 "אופס, רוח זו מחוברת סולאריס?" - Mark Harrison
@Commander, אני הולך להערים את ההערה שלך, אבל יש בדיוק 42 upvotes ברגע זה ממש ... אני פשוט לא יכול. - Massimo
כמו כן, hostname -f ב- Linux מדפיסה את שם התחום המלא ב- Linux. ב- Solaris, הוא מגדיר את שם המארח -f. - 200_success


הייתי אחראי על פרוקסי האינטרנט הארגוני שלנו, שהיה אז המוצר של נטסקייפ. תוך כדי משחק סביב טפסים מנהל (זה היה ממשק מבוסס אינטרנט) היה גדול (ואני נשבע שזה היה אדום) כפתור אמר מחק את מסד הנתונים של המשתמש. אין בעיה, חשבתי. בוא נראה מה האפשרויות שהוא נותן לי כאשר אני מכה את זה. אין ספק שיהיה אישור אם אין אפשרויות.

ללא שם: כן, ללא אישור. אין אפשרויות. אין עוד משתמשים.

אז, ניגשתי למר סולאריס סיסדמין ואמרתי שאני זקוק נואשות לשחזור מהקלטת שאליה הוא השיב: "אני לא מחזיר את הקופסה הזו".

"אה, בואי שוב, "עניתי.

"אני לא מחזיר את הקופסה, זה ברשימת הדברים שלי כדי להוסיף לסבב הגיבוי, אבל עדיין לא הגעתי לזה".

"שרת זה כבר בייצור כמעט 8 חודשים!" אני צרחתי.

מושכת בכתפיה, הוא ענה. "מצטער."


73
2018-05-14 12:26



זה בהחלט סיפור עבור כל אותם אנשים להתלונן על אלה pesky "אתה בטוח?" דיאלוגים;) - MikeyB
ללא שם: אני לא ממש בטוח שאתה צריך להיות אחד לצרוח עליו ... - Mikeage
זה לא באמת תאונה - לחצת על כפתור מחק משתמש User בכוונה, לבוא על אחי ... - Wayne Koorts
כן אתה צודק. דחיפת הכפתור לא היתה תאונה. למעשה מחיקת מסד הנתונים היה חלק התאונה. מה שתגיד... - squillman
לחצן זה צריך להיות ואחריו שניים או שלושה הנחיות אישור. איך זה תכונה שימושית למחוק את מסד הנתונים של המשתמש? אני לגמרי מאשים את המתכנת לשים את הכפתור שם. והעובדה db לא מגובה. "לגאונות יש מגבלות משלה, אבל טיפשות היא לא כל כך נכה". (אלברט האברד). בניין עם ההנחה כי בני אדם אינם סקרנים, קופים רשלנית היא רק בניית אסון. - Jared Updike


לפני שנים רבות את החברה עבדתי עבור לקוח אשר רץ גיבוי לילי של NT 4.0 Server שלהם כונן Jaz (כמו דיסק קיבולת גבוהה).

הקמנו קובץ אצווה, אשר רץ כמשימה מתוזמנת בן לילה. בכל בוקר הם היו אוספים את הדיסק של הלילות האחרונים מהכביש, ולפני שהם עזבו בערב הם היו מכניסים את הדיסק הבא ברצף.

בכל מקרה, קובץ אצווה נראה משהו כזה (כונן Jaz היה כונן F:) ...

@echo off
F:
deltree /y *.*
xcopy <important files> F:

בכל מקרה, לילה אחד שכחו להכניס את הדיסק. השינוי בכונן F: נכשל (אין דיסק בכונן), וקובץ האצווה המשיך לרוץ. ספריית העבודה המשמשת כברירת מחדל עבור קובץ האצווה? CL פעם ראשונה שראיתי שגרת גיבוי להרוס השרת זה היה גיבוי.

למדתי משהו על sysadminning (וטיפול יוצא מן הכלל) באותו יום.

ג 'ים.

נ.ב .: לתקן? "dttree / y F: \ *. *".


66
2018-05-13 20:00



... אנחנו צריכים להסביר מה הכוננים Jaz? האם אני באמת זקן? - Spencer Ruport
זה היה דבר של IOMEGA (זוכרים כונני Zip?) האם היה האח הגדול של כונני ה- Zip, וזה היה כמו דיסק קשיח ללא ראשים, רק לוחות, שנכנס לתוך קופסת פלסטיק עם חלון קטן, וכאשר מוכנס את הכונן, הכונן הוכנס את הכותרות על זה. איפה כמו 1 או 2GB, יקר, נוטים להתחמם יתר על המידה, ולכן לא מומלץ להשאיר את המחסניות בתוך הקורא (זה נאמר על ידי הבוס הישן IOMEGA) - Andor
Hehe, אני אוהב איך כונן jaz מוסבר על ידי השוואה לכונן פשוט כמו מת ו-לא רלוונטי כונן. - Luke
אם זה גורם לך להרגיש מבוגר, יש sysadmins כי מעולם לא ראיתי deltree לפני. - Joseph
הייתי צריך להסביר הרבה מתכנתים כי כאשר אתה מנסה פעולה שמשנה מצב, ועדיין עלול להיכשל ולהשאיר אותך במצב הקודם, אתה צריך לבדוק אם זה הצליח אם אתה הולך לעשות משהו מסוכן אתה צריך להיות במצב הקודם. למה אני צריך להסביר את זה? - carlito


root @ dbhost # find / -name core -exec rm-f {} \;

אני: "אתה לא יכול להיכנס, אוקיי, מה שם ה- DB?"

Cu: "Core".

אני: "אה."


61
2018-05-13 18:31



ומאז ואילך, השימוש בפקודה 'קובץ' נוספה crontab ניקוי ... :) - MikeyB
אלוהים אדירים .... - squillman
אוי אלוהים ... וואו. אני אשים לב לזה, אז אני אף פעם לא עושה את זה. - Glenn Willen


אני אוהב את הדרך שבה כולם מכירים את הסיפור שלהם עם "כשהייתי צעיר / ירוק" כאילו הם לעולם לא יעשו את זה שוב. תאונות יכול לקרות אפילו המקצוענים מנוסה ביותר.

הרגע הגרוע ביותר שלי הוא כל כך רע אני עדיין מקבל palpitations לחשוב על זה ...

היה לנו SAN עם נתוני הייצור על זה. קריטי לחברה. "המורה שלי" החליט להרחיב מחיצות כדי לפנות שטח דיסק. אתה יכול לראות לאן זה הולך? הוא אמר כי התוכנה SAN יכול לעשות את זה לחיות, בשעות הייצור ואף אחד לא שם לב. פעמוני אזעקה היו צריכים להתחיל לצלצל, אבל היו שקטים. הוא אמר שהוא עשה את זה "המון פעמים לפני" ללא בעיות. אבל הנה הדבר - הוא נתן לי ללחוץ על הכפתור שאומר "אתה בטוח?"! כשהייתי חדש בחברה הנחתי שהבחור הזה יודע על מה הוא מדבר. טעות גדולה. החדשות הטובות היו כי LUN יש המורחבת. החדשות הרעות היו ... גם ידעתי שיש חדשות רעות כאשר התחלתי לראות שגיאות בדיסק על תיבת Windows.

אני שמחה שלבשתי מכנסיים חומים.

היה עלינו להסביר מדוע 1 טרה-ביי של נתונים נעלמו בזמן ארוחת הצהריים. זה היה יום ממש ממש רע.

זה עיקרון טוב למעשה - לפני שאתה עושה משהו שיש לך ספקות לגבי, לדמיין צורך להסביר להנהלה אם משהו משתבש. אם אתה לא יכול לחשוב על תשובה טובה להסביר את הפעולות שלך אז לא עושים את זה.


60
2018-05-13 18:22



+1 לפסקה האחרונה - הטכניקה "לשבת על הידיים", רגע אחד חיוני עבור השתקפות - Andy
יש מיומנות מסוימת שאתה מקבל לאחר עבודה עם מערכות לחיות זמן: עכביש תחושה של מה מסוכן ומה לא. כמו השהיה של שנייה נוספת לפני לחיצה על החזרה בשורת הפקודה, או כדי לוודא שלמידע העדכון של SQL יש סעיף תקין שבו (זה כבר מופעל בספירה נבחרת (*)). - jplindstrom
אני רוצה קופץ שאומר משהו כמו "האם אתה רוצה להדפיס את קורות החיים שלך לפני שתמשיך?" .. ויש רק אפשרות אחת: "כן" - warren
1+ עבור העצה בפסקה האחרונה - Jeroen Huinink
+1, כנ"ל. אני זוכרת ששמעתי מחברה מהמערכת כי היו בעיות בהערכת הביצועים השנתית שלו על מהירות ההקלדה שלו, שהוא בזלזול (ובצדק) דחה עם "אני לא מקבל תשלום להקליד מהר. אני מקבל תשלום כדי להיכנס מאוד מאוד לאט ובמהירות ". - MadHatter


Nagios pinged לנו בוקר אחד, כאשר שעות העבודה התחיל לומר כי זה לא יכול להתחבר לשרת לא קריטי. אוקיי, טיול לחדר השרת. זה שרת ישן, Dell 1650 שנרכש ב '02, וידענו כי 1650s כבר נתקל בבעיות חומרה. PFY דוקר את לחצן ההפעלה. שום דבר. הכה אותו שוב, והחזק אותו במשך חמש שניות כדי "לכפות כוח על" ... אשר עוקפת את ההגנה שגיאה BMC, שכן ללא DRAC אין דרך לבחון את היומנים BMC ללא הכוח על המארז.

ההתקן מתחיל ב- POST ולאחר מכן מת שוב. אני עומד מעליו והולך, "אני מריח עשן". אנחנו מושכים את השרת על מסילות זה, ואחד ספקי הכוח מרגיש חם, כך PFY מושך אותו עומד לסגור את התיבה בחזרה. אני אומר, "לא, זה לא אספקת חשמל עשן, זה עשן האם."

אנחנו פותחים שוב את המקרה ומחפשים את מקור הריח הבוער. מתברר סליל משרן וקבל משהו פוצץ את הרגולטור מתח על לוח האם, וריססו נחושת מותכת וקבל goop על פני הכל, shorting חבורה של דברים ובעצם עושה בלגן גדול.

החלק הגרוע ביותר מבחינתי היה ההכרה שעישנתי מספיק חומרה כדי לזהות את ההבדל בין ריח של לוח אם שרוף לבין אספקת חשמל שרופת.


54
2018-05-14 14:49



קריטריונים לבחירת עבודה זו כוללים: חוש ריח טוב. מבריק. - mlp
באדי שלי דפק מעקה של מסילות כונן לתוך דיסק עד כה, שהם נכנסו ללוח המעגל וקצרו אותו. עשן ורוד די. מאוד נבדל. - squillman


לפני שלושה ימים (ברצינות) הייתי מחובר מרחוק לשרת בית הספר, התקנת Service Pack 2 בשרת הקבצים של Windows Server 2008.

החלטתי לתזמן את האתחול הדרוש לשעה מאוחרת בלילה, כאשר המורים לא יחתמו על סיום כתיבת הדו"חות שלהם. הקלדתי משהו כמו:

 at 23:59 "shutdown -r -t 0" 

... אשר אולי עבד בסדר.

אבל אז ניחשתי בעצמי. האם התחביר שלי 'כיבוי' נכון? ניסיתי להציג את העזרה בשימוש על ידי הקלדת

 כיבוי / שעה 

... ומיד איבד את החיבור RDP שלי. פאניקינג, פגעתי בגוגל על ​​התחביר. חיפוש מהיר גילה כי Server 2008 גירסה של כיבוי כולל מתג / h, אשר (כפי שאולי ניחשת) hibernates את המחשב.

המורים התחילו להתקשר אלי תוך דקות כדי לדווח על כך שהם כבר לא יכולים לפתוח או לשמור את כרטיסי הדיווח שעבדו עליהם. מאז שהייתי מחוץ לאתר ואת חדר השרת היה נעול, הייתי צריך להתקשר ישירות מנהל בית הספר וללכת אותה דרך תהליך של powering את המכונה בחזרה.

היום הבאתי עוגיות תוצרת בית לכולם כצורה של התנצלות.


47
2018-05-13 23:53



דוגמה מושלמת של עיצוב ממשק משתמש לקוי בשורת הפקודה: מה קרה ל"עקרון ההפתעה לפחות "? - Mei
ב- DOS / Windows לא? - Jared Updike
זה בדרך כלל /? על Win, אבל יש הרבה כלי עזר, כי הם ported מ UNIX או שנכתב על ידי אנשים UNIX (כולל לא מעט כאלה ב MS) שהם -H או / h - Richard Gadsden
.. אבל אתה עדיין תמיד לנסות את /? ראשון! - warren
בגלל זה אני אוהב את לינוקס. man shutdown. אני יודע שאני לא הולך לגרום לבעיות man! - Josh


בעבודה קודמת, היתה לנו מערכת ביתית גדולה שנרשמה וארכיון כל פיסת דואר שנכנסה, עזבה או נשארה בתוך החברה.

האם את כל תיבת הדואר שלך? אין בעיה! מחפש חתיכת דואר שמישהו שלח לך שבוע / חודש / שנה אבל אתה לא זוכר מי שלח את זה או מה היה הנושא? אין בעיה! אנחנו פשוט תעביר את כל המידע מחודש פברואר לתיקיה מיוחדת.

בשלב מסוים, הצורך הגיע למנכ"ל החברה כדי לפקח על דואר בין המתחרה לבין איש מכירות פנימי בחשדנות. אז אנחנו הגדרת סקריפט מאשר רץ כל לילה ו מסירת דואר רלוונטי מהיום הקודם למנכ"ל. אין בעיה!

בסביבות חודש לאחר מכן הגיעה מילה על בעיה כפולה ודחופה. נראה כי כמו מנכ"ל היה קורא את רשימת הדואר שנשלח $ $ OTHERCOMPANY, הוא נתקל זה אחד:

To: somebody@$OTHERCOMPANY
From: CEO
Subject: CEO has read your message (subject line here)

באופן טבעי, מנכ"ל להיות אדם חשוב וכל, הוא היה עסוק מדי ללחוץ על כל אלה "שלח התקבל" דיאלוגים ב - Outlook ו להגדיר את הלקוח שלו פשוט לשלוח את כולם. באחת מהודעות שנלכדו על ידי מסנן הניטור היתה בקשה לבקשת קריאה. נחשו מה Outlook עשה? ללא שם: בהחלט buggered את הניטור "חשאית".

המשימה הבאה שלנו: הוספת כללים למסנן הדואר כדי לחסום תקבולים לקריאה יוצאת מהמנכ"ל לאותה חברה. כן, זאת היתה הדרך הקלה ביותר. :)


37
2018-05-13 18:35



אבל זה לא חוקי במדינה שלי. בכלל. - mafu
ללא שם: אה, טוב me מדינה. :) בקנדה, זה בסדר גמור. - MikeyB
זה לא חוקי לעקוב אחר דוא"ל נכנס או עוזב את השרתים של החברה שלך? באיזו מדינה אתה חי? - Andrew Ensley
+1 עבור החדשות - Fahad Sadah


אההה, שלי היה לפני כעשר שנים, כשהייתי עדיין מקבל את הרגליים רטובות. היתה לי השמחה של התקנת גיבויים הסוללה על כל המחשבים מתכנתים. הם גם רצו את התוכנה טעון להזהיר את הפסקת חשמל ונסגר כראוי.

אז אני מגדיר את זה על המחשב שלי כדי לבדוק הכל הראשון כמובן ולוודא שזה עובד. אז אני מנתק את כבל החשמל ואת ההודעה עולה על המסך שלי. "כוח חיצוני אבוד, החל כיבוי המערכת".

אז חשבתי, היי מגניב, זה עבד. אבל מסיבה מוזרה כלשהי, אני אפילו לא זוכר, היא שלחה את המסר הזה כהודעת רשת, כך שכל 200 המחשבים בחברה קיבלו את ההודעה, כאשר 100+ משתמשים שבהם מתכנתים.

כן, לדבר על פריק המונית החוצה!

ללא שם: שמרתי את הראש שלי נמוך במקום זה לזמן מה!


36
2018-05-13 19:00



Haha, נשמע כמו מה שקרה לחבר שלי כאן עם "שלח נטו" ועל 1300 נמענים :) - squillman
אוף. עשיתי את "net שלח" דבר בקולג ', גם. חשבתי "הם היו צריכים להשבית את זה" ba-ding! ba-ding! בכל המעבדה, המחשבים הגדילו את המסר. החלטתי להתנצל בפני מנהל הרשת, ובדרך שלי, כל מחשב שעברתי העביר את המסר. / אנחה - Matt Simmons
ללא שם: כן, הליכה של בושה שם! ידידי לא יצא מכיסאו. גם לא טרח לענות לטלפון שלו. - squillman
אהה חבר שלי נטו שלח את כולם לבית הספר "עזרה אני לכוד בחדר 114" וכמובן 60 שניות מאוחר יותר צבא קטן של אנשים הופיע כדי לגלות מי שלח את ההודעה - Mark Henderson♦
השתמשנו למעשה תכונה זו כדי פאנק מנהל מערכת ב המכללה הצעירה שלי. ניקה את כל המעבדות המחשב עם הודעות מזויפות AV הודעות מערכת כיבוי שנראו כאילו הם באו ממנו. הוא חשד מאוד שאנחנו האשמים, אבל לי ולחבר שלי יש אליבי (אני שלחתי את הראשון כשהיה בכיתה והוא שלח את השני בזמן שהייתי בכיתה) ולמחשבים היו כניסות מעבדה גנריות - Shial