שאלה האם יש להגדיר את חומרת הרשת למהירויות "autonegotiate" או למהירויות קבועות?


אנחנו לאחרונה היתה בעיה קטנה עם רשת שבה שרתים מרובים היה לסירוגין לאבד קישוריות רשת בצורה מכאיבה למדי כדי לפתור (נדרש אתחול מחדש קשה). זה נמשך כשבועיים, לכאורה באקראי, על שרתים שונים. אין דפוס מסוים שאנחנו יכולים להבחין בו.

אחרי כמה חפירה לתוך זה, ראינו כי המתג היה דיווח 100 Mbps עבור יציאת הבעיה:

זה נשמע מדהים כמו מה שקרה במאמר ג'ואל ספולסקי חמש וויס

מייקל בילה זמן מה לאחר המוות, וגילה כי הבעיה היא בעיה פשוטה תצורה על המתג. יש כמה מהירויות אפשריות שמתג יכול להשתמש בהן כדי לתקשר (10, 100, או 1000 מגה-ביט לשניה). אתה יכול להגדיר את המהירות באופן ידני, או שאתה יכול לתת את המתג באופן אוטומטי משא ומתן על המהירות הגבוהה ביותר כי שני הצדדים יכולים לעבוד עם. המתג שנכשל הוגדר כאוטומטי. זה בדרך כלל עובד, אבל לא תמיד, ובבוקר של 10 בינואר, זה לא.

עכשיו יש לנו נכים משא ומתן אוטומטי על חומרת הרשת שלנו ולהגדיר אותו בקצב קבוע של 1000 Mbps (gigabit).

השאלות שלי לאלה עם יותר שרתים המומחיות חומרה ברשת:

  1. כמה נפוץ משא ומתן אוטומטי עם בעיות חומרה ברשת המודרנית?
  2. האם זה נחשב טוב, בפועל רשת רגילה להשבית משא ומתן אוטומטי ולהגדיר מהירויות קבועות בעת הגדרת רשת?

87
2018-01-25 18:57




האם אתה מושבת אוטומטי משא ומתן על השרתים שלך גם קבוע להם 1000 / מלא? - James
זה רק אני, אבל אם אני רץ אל הבעיה שלך אני תוהה מדוע המתג והשרת אינם משא ומתן על מהירות העדיפות הגבוהה ביותר (1000 / מלא). זה אומר לי משהו נשבר על ידי אילוץ הקישור במהירות מסוימת אתה פשוט מכסה את הנושא. - Doug Luxem
יש כמה פלטפורמות (בעיקר Solaris 9) שיש להן בעיות עם autonegotiation בתרחישים ידועים - אני משתמש רק עם כל דבר שנעשה בעשור האחרון, למרות - warren
משהו שכמעט החליק אותי ורוד: serverfault.com/questions/328105/ethernet-interface-errors - nixnotwin


תשובות:


  1. אני עדיין לא רואה בעיה עם משא ומתן אוטומטי של מהירויות הרשת כי הוא לא נגרם על ידי (א) אי התאמה של ידני על קצה אחד של הקישור אוטומטי על השני או (ב) מרכיב נכשל של הקישור ( כבל, יציאה, וכו ').

  2. זה תלוי מנהל, אבל הניסיון שלי הראה לי שאם אתה באופן ידני לציין את מהירויות הקישור הגדרות דופלקס, מאשר אתה חייב לרוץ לתוך mismatches מהירות. למה? כי זה כמעט בלתי אפשרי לתעד את הקשרים השונים בין בוררים ושרתים ולאחר מכן בצע את התיעוד בעת ביצוע שינויים. רוב הכישלונות שראיתי הם בגלל 1 (א) ואתה רק להיכנס למצב זה כאשר אתה מתחיל ידנית הגדרת מהירות / הגדרות דופלקס.

כפי שצוין ב תיעוד של CiscoYou

אם אתה משבית autonegotiation, הוא מסתיר טיפות קישורים ושכבות פיזיות אחרות. רק להשבית autonegotiation למכשירים הקצה, כגון NICs Gigabit ישנים שאינם תומכים autonegotiation Gigabit. אין להשבית autonegotiation בין מתגים אלא אם כן נדרש, כמו בעיות שכבה פיזית יכול ללכת מבלי שיבחינו וכתוצאה מכך פורש עץ לולאות.

אלא אם כן אתה מוכן להגדיר מערכת ניהול שינויים עבור שינויים ברשת הדורש אימות של מהירות / דופלקס (וגם לא לשכוח בקרת זרימה) או מוכנים להתמודד עם אי התאמות מזדמנים שמגיעים ידנית ציון הגדרות אלה על כל התקני הרשת, ואז מקל עם תצורת ברירת המחדל של אוטומטי / אוטומטי.

בעתיד, שקול לעקוב אחר השגיאות ביציאות המתגים MRTG כך שתוכל לזהות את הבעיות האלה לפני שיש לך בעיה.

ערוך: אני רואה הרבה אנשים מתייחסים לכישלונות משא ומתן על ציוד ישן. כן זה היה בעיה לפני זמן רב, כאשר הסטנדרטים היו נוצרו ולא כל המכשירים אחריהם. האם ה- NIC והמתגים שלך בני פחות מ -10 שנים? אם כן, אז זה לא יהיה בעיה.


101
2018-01-25 19:15



Cacti הוא בעצם MRTG ללא בלגן תצורה אז זה צריך להיות טוב. רק להתחיל ניטור טיפות RX וטעויות, התנגשויות TX, וכו 'אחד או יותר של מונים אלה יהיה "גבוה" אם יש לך בעיה משא ומתן. גבוהה להיות יחסית לכמות התנועה בנמל. - Doug Luxem
@EK - התצורה צריכה להיעשות על המתג ועל המכשיר. החלפת המכשיר (או אולי רק שדרוג נהגים / קושחה), יציאות נעות, או החלפת המתג כל כך הם חששות עבור הגדרות לא תואמות. אני לא בטוח למה אתה רואה כל כך הרבה שגיאות - אנחנו מנהלים את HP, סיסקו, אקסטרים וג 'וניפר כאן ואני אף פעם לא רואה משא ומתן אוטומטי בעיות. הבעיות היחידות שראיתי הן כאשר קצה אחד של הקישור מוגדר באופן ידני. כמו סיסקו מזכיר את doc, אולי יש לך כמה בעיות L1 הבסיסית? - Doug Luxem
הניסיון שלי באמצעות HP, Cisco, ו- Dell מתגים תואם w / DLux. אני מנחש על ידי upvotes כי הרבה אנשים אחרים מרגישים באותו אופן. רשתות שבהן מנהלי מערכת דתי להגדיר מהירויות דתי / דופלקס תמיד היו הרבה יותר בעיות w / mismatches מאשר רשתות שבו הכל היה מוגדר autonegotiate. - Evan Anderson
קישורים @ Whisk WAN הם סיפור אחר. כאשר אתה מסר קישורים Ethernet מספק כלשהו, ​​לעתים קרובות הם נאלצים ידנית או באמצעות מקמ"ש שאינו תומך משא ומתן אוטומטי. אלה די הרבה צריך להיות מטופלים על בסיס מקרה לגופו. - Doug Luxem
אני חושב ההצבעה היא קצת מטעה כי כמה אנשים יהיו מותרות של חומרה מ 1 או 2 ספקים (או פשוט לא מנוסה הרבה) ולא לראות בעיה בעוד אחרים כמוני יהיה בירושה ציוד מהרבה ספקים שונים שעושה misbehave שילובים מסוימים. - JamesRyan


  1. נפוץ מאוד, היו לי בעיות רבות לאורך השנים עם סוגים שונים של חומרה.

  2. לדעתי אם ההתקנה היא סטטית (כלומר, מתלה שרת) ואתה לא חושב שיהיו שינויים זה רעיון טוב כדי להגדיר את המהירות ואת דופלקס ידנית. כל עוד הוא מתועד היטב, כך שניתן יהיה למנוע בעיות בעתיד.

עריכה:

רק כדי להבהיר, אני לא ממליץ להשתמש במהירויות ידניות על הרשת כולה, הייתי אומר כי 95% מהזמן אוטומטי / אוטומטי היא הדרך ללכת. אני רק אומר שיש לי בעיות עם דופלקס / מהירות ויש חלקים קטנים של הרשת שלי (כלומר אחד המדפים השרתים שלנו), כי יש בעיקר הגדרות ידניות. אנו פועלים LAN מבוקר מאוד עם יציאות שאינן בשימוש להיות כיבוי MAC- מסננים על רוב היציאות כך שמירה על המסלול של המהירות היא לא קשה מאוד.


23
2018-01-25 19:03



מצאתי את אותה בעיה, אבל אולי רק 1/100 שרתים יהיו סוג של בעיות autonegotiate. שלה בדרך כלל לא מורגש על רשתות קטנות אבל מספיק כדי להיות מעצבן על אלה גדולים יותר. - Dave Drager
+1 - גם אני ראיתי את האוטומטי משא ומתן בעיה קופצת לאורך השנים. לאחר צוות סטנדרטיזציה על השבתת אוטומטי משא ומתן עבור כל בוררים בוטלו כי הבעיה עבורנו. - Joe Doyle
שום דבר להוסיף על זה, חוץ מזה אני יכול הד כי ראיתי בעיות רבות. אם למישהו אחר יש מידע על למה autonegotiate נכשל כך (יחסית) באופן קבוע, אני אשמח לשמוע את זה. - Schof
@dave כך הסיכוי לבעיה autonegotiate להתרחש עם גודל ומורכבות של הרשת - זה הגיוני. כמו כן, עשינו להרחיב שרת הרשת הקטן שלנו מדף במהלך השנה האחרונה על ידי 3x ... - Jeff Atwood
@Jeff Atwood: רק אם "הגודל" migt להתייחס הסיכויים טובים יותר של הוספת מכשיר עם התנהגות autonegotiate שבור היה פוטנציאל בעיות להגדיל. זה לא כמו הצפה של מסגרות או שידור התנועה. Autonegotiation הוא בהחלט בין כל מכשיר הלקוח וכל יציאה לעבור. - Evan Anderson


אני מאמין שאם autonegotiation עבד במשך שעה ביום או חודש ואז מסיבה כלשהי "קורה משהו" כי הגדרת הקישור למהירות קבועה "מתקן" את זה יש בעיה זה לא נפתר אבל עוקף במקום. אני מניח שאני רואה את הקישור קבוע כפתרון זמני עד הבעיה האמיתית מתקנת.


15
2018-01-25 19:47



אפשרי לחלוטין; כבר עשינו חבורה של פתרון בעיות אחר כדי לפסול דברים, אבל הייתי מודאג כי הצוות של ג'ואל היתה אותה בעיה כפי שתועד "Five Whys". זה נראה די נפוץ .. - Jeff Atwood
אני מסכים את הבעיה עם autonegotiation מתרחשת "לעתים קרובות", אבל ברוב המקרים אחרי זה עבד עבור "בעוד". זה מה שמבקש ממני להמשיך לחקור במקום להשתמש בקישור קבוע כ"פתרון "אני מתכוון ... אם המכונית שלך" פועל בסדר "להתחיל לרוץ גס, אלא אם כן מתחמם במשך 10 דקות, לא היית אומר את עצמך "היי זה מתחיל להיות מבוגר ועכשיו זה צריך להתחמם במשך 10 דקות" היית לוקח את זה כדי להיות הסתכל על ההזדמנות הראשונה שלך כי "משהו לא בסדר" זה לא היה לפני :) - dimitri.p


לכן, השלבים הבאים לפתרון בעיות (נניח שאתה מפסיק אחרי כל אחד מהם וממתין עד שהבעיה תופיע מחדש):

  1. בדוק את היומנים במתג כדי לראות אם הוא מספר לך למה הוא משתמש ב- 100M.
  2. אם אתה עדיין מפעיל את זה, לבטל את זה רע מאוד "Windows איזון עומס" שטויות כי יואל הוא דוחף כל הזמן - הדרך בה זה עובד היא על ידי שבירת המטמון של המתג, מכריח אותו תהליך התוכנה כל מנה. המתג שלך נועד להעביר מנות בחומרה, ויש לו רק את המעבד הדרוש כדי להבין איזה נתיב פיזי זרימת תנועה לא ידועה צריכה לקחת (in -> asic -> out) ולתכנת את החומרה לעשות זאת (ראה: a מחשבון יש מעבד טוב יותר מאשר הבורר שלך, לא עושים דברים טיפשים שהופכים את המעבד של הבורר שלך לעבוד קשה יותר). Windows איזון עומס עובד על ידי ביצוע הבורר שלך לעשות את ההחלטה ולהתקין מחדש את המטמון חומרה עבור כל מנה. זה לא יכול לתקן את הבעיה הזאת, אבל זה באגים אותי פודקאסטים ... מצטער.
  3. ודא את התצורה התאמות משני הצדדים - נשמע כאילו עשית את זה
  4. Google עבור באגים autong על המתג שלך - אלא אם כן אתה בנוי זה בעצמך, אתה לא היחיד מנסה להפעיל את autoneg על מה זה אתה משתמש
  5. החלף את הכבל, עם Cat5e מדורג או יותר טוב - אידיאלי כבל אתה יודע עובד, כמו אחד תחנת העבודה שלך מחובר. אל תנסו להשתמש ב- Cat5, או באיזה חרא שמישהו עשה, להשתמש באחד שיש לו קצוות יצוק בפועל מתוך החבילה.
  6. הזז את היציאה - שים את השרת ביציאה אחרת באותו מתג
  7. לשנות את NIC - להשתמש אצווה שונה הורה בזמן אחר

בשלב זה, חיסלת את התצורה, את היציאות הפיזיות שאתה מחובר אליהם, את הכבלים ביניהם. אם זה עדיין קורה, כמה סיבות אחרות עשויות להיות:

  1. ניתוב כבל - היזהר בהתערבות EM מכבלי החשמל שלך, נתב אותם בצדי שונים של המעמד.
  2. קירור - ודא שאתה temp הסביבה היא לא משהו כמו 90 מעלות כרטיסי NIC שלך הם לא נופלים לתוך איזה "אלוהים היקר תן לי רק קדימה זה אחד מנות בבקשה" מצב. שמעתי אבל לא ראיתי נתבים סיסקו להפסיק לעשות מיתוג מהיר מנות קדימה קדימה באמצעות מעבד כאשר הם התחממות יתר, למשל.
  3. החלף את המתג במשהו שאינו מוצץ - בדוק כמה רוחב פס המארחים שלך מדברים לשנייה במצטבר, ולאחר מכן תסתכל על קיבולת ה- backplane המדורגת של המתג שלך. 7 המארחים מתוך פוטנציאל 48 כל משדר 1.0G מספיק כדי לעצור סיסקו 3750, למשל. גם להיות מאוד זהיר לגבי זולו גם רץ ספקי רשת: D-Link, Linksys, Dell, אינטל, ו- HP. אף אחד לא מטפל ברשתות ברצינות משתמש בחבר'ה האלה, ולא בגלל ש"אף אחד לא פוטר מעולם בגלל שימוש בסיסקו ", אלא משום ש"אנשים זוכרים שהמתג של אינטל שהיה 20/48 יציאות נכשל במשך יותר משנתיים" או "הייתי משתמש בפרוקורב באופן בלעדי על איך סיסקו הרשע היה, עד שאני ממש בשימוש סיסקו, ואז הפסקתי לקנות משהו פחות ". סיסקו נחשבת אמצע טווח ספק רשת, אז מה זה אומר לך על החבר 'ה להלן סיסקו ...? Youנות

רקע / למה התשובה שלי היא הכי מדהימה: אני עובד בתור מהנדס רשת / מערכות בתעשייה הפיננסית, והנה הניסיון שלי עם רשת קטנה שלנו ish העולמי (15 סניפים, 8 datacenters):

כל יציאות LAN שלנו הם autoneg, כי אנחנו שולטים על הציוד בשני הקצוות, ויש לי איזושהי גישה לשני הצדדים --- אשר עשוי להיות פשוט כמו מקבל בטלפון למישהו שיש להם לבדוק הגדרות. בתוך שלוש שנים, אני רק פעם היה אחד היציאות הפנימיות שלנו להיכשל בשל autoneg כשלון, וזה היה בגלל כבל רע --- זה הלך אחרי החלפת הכבל.

היו לנו הרבה יותר בעיות שבהן קודמיו היו מקודדים 100 / מלא על NICs שלהם, ולא תיעד את העובדה. איפוס הכל אוטומטי / אוטומטי בחלון הבא לשמור ולא היו בעיות עם אותם מאז.

על שני המקומות שבהם יש לנו נחושת הידוף מ מוביל עבור WAN שלנו? אתה צריך די מצפה WAN נחושת / חיבור לאינטרנט למצוץ, כל הזמן --- חלקית כי אין לך מושג מה בצד השני. כמה מתג אקסטרים עתיק שקורה קושחה באגי עבור autoneg אבל עושה תיוג MPLS? כ 5 $ ממיר מדיה כי 200,000 $ של ספק שירותי האינטרנט שלך Ciena קצה המכשיר הוא פשוט מדהים מדי כדי לספק Ethernet על זוג מעוות? החלט מראש איך זה יטופל ו מקל על זה, ואז מצפים כמה twit בתוך המוביל כדי לשנות את זה בשעה 10 על יום שבת, כי הסכימו על התצורה מעולם לא תועד ויש להם מדיניות כלשהי כדי לעקוב אחר.

ברצינות, עם זאת, לקבל הידוק סיב מספק שירותי האינטרנט שלך.


15
2018-01-26 12:37



רק הסתובבתי כדי לקרוא את זה - תשובה מצוינת. - Helvick
תשובה מצוינת. - Rushino
רק כדי שהתשובה הסופית היא כאן, איפשהו, זה היה נהגים גרועים של ברודקום. לא הצלחנו למצוא כל סט שעבד. המעבר ל- Intel NICs תיקן אותו ב -100%. blog.serverfault.com/2011/03/04/broadcom-die-mutha - Jeff Atwood
@JeffAtwood האם אותה בעיה? חשבתי שזה אחד בסופו של דבר במעקב למטה למצב חיסכון בחשמל על המתג ... - James Cape


הרשת שאני אחראי עליה (יחד עם כמה בחורים אחרים) מורכבת מ -40 שרתים, 1000 תחנות עבודה (מתפרסות על פני קמפוס גדול למדי) ו- 1000 WAPs מתפשטות גם על פני שטח גדול עם סוגים וגילים שונים של ציוד רשת.

כמו שאמר דימיטרי, כשמשהו פתאום נכשל להפסיק את האוטונומיה, זה בדרך כלל סימן לבעיה אחרת. הגדרת היציאה באופן ידני היא דומה לשים bandaid על מישהו שקיבל דקר במעיים - זה עלול לעצור את הדימום, אבל אין ספק שיהיה נזק מתחת.

רשימת הבדיקה הרגילה שלי:

  • האם משהו השתנה במכונה? דרייברים? הגדרות ברמת מערכת ההפעלה או ה- BIOS? אולי autoneg היה מושבת במערכת ההפעלה?
  • יש לך להחליף את הכבלים תיקון, ו מאומת הכבל פועל (אם זה יומני לרוץ ממדף אחד?)
  • בדקת כדי לראות אם יציאת המתג פגומה או נכשלת?
  • האם ה- NIC עלול להיות רע?

אנחנו, ככלל, לעולם לא להשבית autoneg בשרתים (או כל דבר אחר במרכז הנתונים), אלא אם כן זה מצב שבו כל הסיבות האפשריות אחרות בוטלו, העברנו יציאות מתג, שינינו כבלים, בדקנו את ה- NIC וכו ', ואין ברירה אחרת. ובמקרה זה הוא מתועד למוות. זה קורה לעתים רחוקות מאוד, ובדרך כלל עם מכשירים שאנחנו לא יכולים לקבל גישה לבדוק BIOS והגדרות OS.

תחנות העבודה ו- APs, לעומת זאת, הן סיפור אחר. הכשל האוטומטי נכשל הוא סימן קלאסי להפעלת כבל רע, ולעתים רבות אנו צריכים להגדיר מהירות ידנית ודופלקס עד שהקיץ יגיע לעונת הקיץ החדשה - כבלים בעונה.


14
2018-01-25 20:08



החלפנו כבלים ויציאות שוב ושוב בשרת "בעיה", וחזרנו להשתמש במלאי "בתיבה" (Server 2008 R2). זה קורה גם בשרתים מרובים של תצורה זהה. אני מתקשה להשלים עם "לא לעשות את זה!" ו "תמיד לעשות את זה!" בתשובות לאותה שאלה. - Jeff Atwood
@Jeff: היכרות עם השאלה שאתה והצוות שלך פורסמו במקור (serverfault.com/questions/104791) אני מעוניין לשמוע אם הבעיה היא בעקבות יציאת המתג או יציאת ה- NIC במחשבי השרתים של הבעיה. מה הוא עושה / מודל של NIC / שבבים, בכל זאת? - Evan Anderson
@Jeff - כמה תשובות אינן בינאריות :) זה עושה את זה כאשר אתה צריך, עד שיש לך הזדמנות להבין מה הבעיה. - dimitri.p
@evan קורה על כל שרת שכבת האינטרנט, לא בעקבות כל מתג היציאה או כרטיס Ethernet. אם זה עדיין בעיה לאחר השינוי הזה, זוהי בעיה בתוכנה. השרתים הם Lenovo RS110 x6 ו- Lenovo RD120 x2. - Jeff Atwood
רק כדי לוודא שהתשובה הסופית נמצאת כאן, איפשהו: זו היתה בעיית נהיגה אצל ברודקום. לא הצלחנו לפתור אותה עם כל נהג ידוע. רק "לתקן" היה לעבור אינטל NICs. - Jeff Atwood


זה מיתוס ברשת. החבר 'ה ברשת שלנו נשבע על ידי שטויות, כי בשנת 1998 בוררי ביי לא לנהל משא ומתן עם סיסקו או משהו. אז במקום להשתמש ברירת המחדל עבור 99.999% של הציוד על כדור הארץ, יש לנו את התרגיל הזה מגוחך ניהול תצורה השעיר לעזאזל גדול עבור אותם זמנים שבהם עדכון הנהג NIC מאפס את ההגדרות למשא ומתן אוטומטי וכל דבר קורה.

זה עשה יותר משעשע כי רבים של השרתים שלנו להשתמש בתכונות מפוקפקות כמו NIC teaming, אשר מונעים ממך לאבד גישה לרשת באירוע בלתי סביר של כישלון הבורר, תוך חשיפת לך את כישלון התוכנה הרבה יותר סביר. (הנהגים תמיד למצוץ)

להגנה על החבר 'ה ברשת, שפע של severs פועלים עם Windows ברירת מחדל NIC נהגים, אשר בדרך כלל למצוץ. אם יש לך בעיות עם autonegotiate, ואת הציוד שלך אינו תאריך לממשל קלינטון, לעדכן את הנהגים האלה NIC.


10
2018-01-26 04:16



זה היה בסופו של דבר נהגים רעים, אבל התיקון היחיד שיכולנו למצוא היה לעבור אינטל NICs. עכשיו יש לנו נצחון לכל החיים נגד ברודקום NICs. - Jeff Atwood


אתה צריך משא ומתן אוטומטי. אם יש לך בורר שלא יהיה משא ומתן אוטומטי באופן אמין, לקנות מתג טוב יותר.

Gigabit הוא אמור כדי משא ומתן אוטומטי, וזה כולל Auto-Crossover (MDI-X) איתור.

100baseT הוא מובטחת כדי להיכשל אם קצה אחד מוגדר אוטומטי והשני להגדיר ידנית, וזה לפי המפרט. אם אתה כופה קצה אחד עד 100 / מלא ואז את הקצה השני רצון אוטומטי משא ומתן ל 100 / חצי, נותן לך אי התאמה דופלקס.


10
2018-01-26 10:12