פתרונות ושרותי מיחשוב - פיתוח תוכנה, בניית אתרים,
יעוץ ושירותי מיקור חוץ (outsourcing)

yair@yairweissman.com        Tel: 0544-301265        יאיר ויסמן

שירותים לעסקים זעירים, קטנים וגדולים - תמיד במסגרת התקציב ותוך עמידה בזמנים!


מידע כללי

.........................

שרותי מיחשוב

.........................

פרויקטים ולקוחות

.........................

טכנולוגיות וכלים

.........................

English / אנגלית   Hebrew / עברית
.........................

הורד PDF קובץ

.........................

גיבוי נתונים וגיבוי מידע - data backup and information backup


גיבוי נתונים - Data backup

בהקשר של מערכות מידע, המושג גיבוי נתונים מתייחס לפעולת העתקת מידע כך שהעתקים אלו יוכלו לשמש כדי לשחזר את המידע המקורי לאחר ארוע בו אובד המידע. העתקים אלו נקראים גיבויים. גיבויים שימושיים בעיקר בשני מקרים: כדי לשחזר מחשב למצב בו יפעל שוב לאחר אסון (התאוששות מאסון) ולשחזר מספר קבצים ספציפיים לאחר שנמחקו או הושחתו.

בגלל חפיפה חלקית בין טכנולוגיות שונות, קיימת נטייה לבלבל בין גיבויים (backup) ומערכות גיבוי (backup systems) לבין גניזה (archives) ומערכות למניעת תקלות (fault-tolerant systems). גיבוי שונה מגניזה בכך שגניזה היא העתק ראשוני של המידע וגיבוי הוא העתק משני של המידע. מערכות גיבוי שונות ממערכות למניעת תקלות בכך שמערכות גיבוי מניחות שתקלה תגרום לאובדן-מידע, ואילו מערכות למניעת תקלות מניחות שתקלה לא תגרום לאובדן מידע. גיבוי הוא בדרך כלל קו ההגנה האחרון כנגד אובדן מידע ולכן גם הכי פחות נוח לשימוש.

מכיוון שמערכות גיבוי מכילות לפחות העתק אחד של המידע, נפח האיחסון הדרוש הינו משמעותי. אירגון האיחסון וניהול תהליך הגיבוי יכול גם להיות מורכב.

איחסון - הבסיס של כל מערכת גיבוי

שיטות גיבויים

כל אסטרטגיית גיבוי מתחילה עם עיקרון של גיבוי המידע. הנתונים המגובים צריכים להיות מאוחסנים במקום כלשהו וצריכים להיות מאורגנים במידה מסוימת. האירגון יכול להיות פשוט כדף נייר עם רשימה של קלטות הגיבוי והתאריכים בהם בוצע הגיבוי, או מתוחכם יותר תוך שימוש בבסיס-נתונים. לעקרונות שונים יש יתרונות וחסרונות יחסיים וזה מתקשר לבחירת מנגנון החלפת הגיבויים.

Unstructured
גיבוי מסוג זה יכול להיות בצורה הפשוטה ביותר ערמה של CD עם מידע מינימלי על התוכן המגובה וזמן הגיבוי. סוג זה של גיבוי נתונים הוא הפשוט ביותר ליישום אולם נותן אפשרות שיחזור מידע ברמה הנמוכה ביותר.

Full + Incrementals
המטרה העיקרית לשימוש בסוג זה של גיבוי מידע הוא לאפשר איחסון של מספר העתקים של המידע המגובה. בשלב ראשון נעשה גיבוי מלא (full) של המידע ולאחר מכן נעשה גיבוי תוספות (incremental) - רק הקבצים ששונו מאז הגיבוי האחרון יגובו. שיחזור מערכת שלמה לנקודת זמן מסוימת מצריכה את מציאת הגיבוי המלא האחרון שנעשה לפני נקודת הזמן הרצויה ואת כל גיבויי התוספות שנעשו מאז ועד נקודת הזמן הרצויה. סוג גיבוי זה מבטיח רמת ביטחון גבוהה שניתן יהיה לשחזר את המידע הדרוש אולם החסרון הוא בתהליך הארוך של השיחזור ובדרישה הגבוהה לאיחסון.

Full + Differential
סוג גיבוי מידע זה שונה מהסוג הקודם בכך שגיבוי מסוג Full + Incrementals מגבה את התוספות מאז גיבוי התוספות האחרון ואילו גיבוי מסוג Full + Differential מגבה את השינויים מאז הגיבוי המלא האחרון, למרות שיתכן ורוב המידע המגובה זהה למידע שגובה בגיבוי השינויים האחרון. היתרון בגיבוי מידע זה הוא ששיחזור המידע מצריך רק את השיחזור המלא האחרון ולאחריו את שיחזור השינויים האחרון (גם אם יש הרבה גיבויי שינויים ביניהם).

Mirror + Reverse Incrementals
סוג גיבוי זה דומה מאוד לגיבוי Full + Incrementals. ההבדל הוא שבמקום גיבוי מלא ש-"מזדקן" ולאחריו סדרה של תוספות, מודל גיבוי זה מציע העתק מדויק של הנתונים בזמן הגיבוי האחרון והיסטוריית גיבויים של שינויים.אחד היתרונות בסוג גיבוי מידע זה הוא שיש צורך של גיבוי מלא בלבד בהתחלת התהליך. כל גיבוי שינויים מתווסף באופן מיידי להעתק הגיבויים האחרון וכך נוצר העתק עדכני יותר. סוג גיבוי זה לא מתאים לשימוש עם מדיית איחסון שאינה קבועה משום שכל גיבוי מצריך השוואה לתוצאת הגיבוי האחרון.

Continuous data protection
סוג גיבוי מידע זה עושה שימוש בעיקרון מתקדם יותר לפיו במקום לתזמן גיבויים בזמנים קבועים מראש, מערכת הגיבוי מגבה כל שינוי באופן מיידי. השינוי בין שיטה זאת לבין disk mirroring הוא ששיטה זאת מאפשרת להחזיר את הנתונים במערכת לנקודת זמן בעבר.

צורת האיחסון - Storage media

ללא קשר לעיקרון גיבוי המידע כפי שפורט למעלה, המידע צריך להיות מאוחסן על מדיה כלשהי במקום כלשהו.

סרט מגנטי
סרט מגנטי נמצא כבר זמן רב בשימוש נפוץ לגיבוי, גניזה וניוד של נפח מידע גדול. בעבר נפח המידע שסרט יכול להכיל היה רב בהרבה מזה של דיסק, אולם עם התפתחות הטכנולוגייה, יחס זה השתנה וכיום אין משמעות להבדל בין הנפחים.

דיסק קשיח
ירידת מחירי הדיסקים הקשיחים ביחס לנפח המידע שהם מציעים גורם להם להיות יותר תחרותיים מול הסרטים המגנטיים. היתרון העיקרי של איחסון על דיסק קשיח הוא זמן הגישה הנמוך וקלות השימוש. דיסקים יכולים להיות חיצוניים בעזרת שימוש בחיבורים כגון SCSI, USB, Firewire, Ethernet ואפילו Fibre Channel.

דיסק אופטי
ניתן להשתמש ב-CD כאמצעי לגיבוי והיתרון הוא שניתן לשמור עד 800MB של מידע על CD בודד ושניתן לקרוא אותו (לשיחזור) בכל מחשב בו מורכב כונן CD. בדומה, ניתן להשתמש ב-DVD בו נפח האיחסון יכול להגיע ל-9.4GB.

זיכרון מוצק (Solid state storage)
התקני זיכרון מסוג זה כוללים: flash memory, thumb drive, USB keys, compact flash, smart media, memory stick, secure digital cards ועוד. התקנים אלו יקרים יחסית לנפח המידע אותו הם מסוגלים לאחסן אולם יתרונם הוא בניידות ובקלות השימוש.

שירותי גיבוי מרחוק
ככל שגישה רחבת-פס מהירה לאינטרנט נעשית פופולרית יותר, כך גם שירותי גיבוי מרחוק נעשים פופולריים. גיבוי לאתר מרוחק דרך האינטרנט יכול לספק הגנה כנגד מקרים קיצוניים כמו אש, הצפה או רעידת אדמה אשר יכולים להרוס גם גיבויים מקומיים יחד עם כל שאר הציוד. החיסרון בשיטת גיבוי מידע זאת היא שמהירות הגיבוי דרך האינטרנט נמוכה יותר מאשר גיבוי מקומי וזה יכול להוות בעייה אם יש צורך לגבות כמויות אדירות של מידע. בנוסף, קיים הסיכון המוכר של מתן שליטה על גיבויי המידע הרגיש, לפעמים, בידי צד שלישי.

ניהול גיבויי המידע

בנוסף לבחירת עיקרון גיבוי המידע ובחירת צורת האיחסון, צריך גם לאזן בין קלות הגישה לגיבוי, אבטחת המידע והעלות.

On-line
איחסון גיבוי On-line הוא בדרך-כלל הנגיש ביותר, וניתן להתחיל לשחזר את המידע תוך שניות. סוג איחסון זה הינו נוח ומהיר, אולם יקר יחסית ופגיע מבחינת מחיקת המידע - בטעות או ע"י וירוס מחשבים. דיסק קשיח משני או מערך דיסקים הם דוגמאות לצורת גיבוי זאת.

Near-line
איחסון זה הוא פחות זמין ופחות יקר אך עדיין מאוד שימושי כצורת גיבוי נתונים. כדוגמא ניתן לתת ספריית סרטים מגנטיים עם זמן גישה שיכול להגיע עד מספר דקות. התקן מכני מעורב כדי לשנע את הקלטת הרלוונטית אל הטייפ לצורך קריאה או כתיבה.

Off-line
שיטה זאת דומה לשיטה הקודמת שתוארה, אולם היא מצריכה התערבות של משתמש כדי לבחור או להזין את המדיה הנכונה. דוגמא לכך היא שמירת קלטות בארונית והכנסת הקלטת הרצויה לטייפ באופן ידני.

Off-site vault
כדי להגן כנגד אסון, משתמשים רבים בוחרים לשלוח את מדיית הגיבוי לשמירה באתר חיצוני ומאובטח. זה יכול להיות פשוט כמו הבית של אחראי המחשבים באירגון או מורכב כמו מבנה מוגן כנגד אסונות, מבוקר אקלים ושמירה רציפה.

Backup site or Disaster recovery center
במקרה של אסון, המידע המגובה לבדו לא תמיד יהיה מספיק להתאוששות מלאה. מערכות מחשב שאליהן יש לשחזר את המידע דרושות גם, וכן הרשתות והקונפיגורציות הנכונות. לאירגונים מסוימים יש מרכזי התאוששות מאסונות המצוידים למקרי אסון קיצוניים. מכיוון שמדובר בהשקעה כספית גדולה מאוד, רוב החברות המעוניינות בפיתרון מסוג זה עובדות בשיטה של מיקור חוץ ומשתמשות במרכזי התאוששות מאסונות של צד שלישי.

בחירה, גישה ושימוש במידע

גישות שונות לגיבויי קבצים

ההחלטה על איזה מידע לגבות בכל עת היא תהליך קשה יותר ממה שנראה. גיבוי של מידע רב יותר מהדרוש יגרום למילוי נפח האיחסון בקצב גבוה מאוד, ואילו אם לא יגובה מספיק מידע, מידע חשוב עלול להאבד. העיקרון המוביל במקרה זה הוא שיש לגבות רק את הקבצים שהשתנו או שנוספו.

העתקת קבצים
העתקת קבצים למקום איחסון אחר ע"י שימוש בפקודת העתקה של מערכת ההפעלה.

העתקת partition
העתקת partition מעתיקה את כל הקבצים הקיימים באותו partition. בדרך כלל זוהי דרך מהירה בהרבה מאשר להעתיק את כל הקבצים כמו בשיטה הקודמת.

סימון שינויים
מערכות הפעלה שונות משתמשות בביט ה-archive הצמוד לכל קובץ כדי לסמן שהיה שינוי בקובץ. קיימות גם תוכנות גיבוי הבודקות את התאריך בו שונה הקובץ ומשוות אותו לתאריך הגיבוי האחרון כדי להחליט אם היה שינוי בקובץ.

גישות שונות לגיבוי "מידע חי"

אם מחשב נמצא בשימוש בזמן שנעשה גיבוי, קיים סיכון שקבצים יהיו פתוחים לקריאה או לכתיבה. במקרה כזה, המידע על הדיסק עלול לא לשקף בדיוק את כוונת המשתמש. מצב זה בדרך כלל נכון לגבי קבצים של בסיסי נתונים.
חשוב להבין שגיבוי קובץ גדול של בסיס נתונים יכול לקחת מספר דקות. כדי לגבות קובץ הנמצא בשימוש, הכרחי שהגיבוי ישקף העתק מדויק של הקובץ בנקודת זמן אחת - דבר המהווה אתגר כשמנסים לגבות קובץ שמשתנה כל הזמן. כדי למנוע מצב זה, קובץ בסיס הנתונים חייב להיות נעול כדי למנוע שינויים, או שצריך ליישם שיטה המבטיחה ש-"תמונת" הקובץ נשארת ללא שינוי זמן שיספיק לפעולת הגיבוי, בזמן שבקשות השינויים נשמרות במקום אחר. גיבוי קובץ תוך כדי שהוא משתנה יכול לגרום למצב בו החלק הראשון מגובה לפני שנעשה השינוי והחלק השני מגובה לאחר שנעשה השינוי. בקבצי בסיסי נתונים בהם יש קישורים בין חלקי הקובץ השונים, דבר זה יגרום ליצירת קובץ גיבוי שאינו בר שימוש.

גיבוי Snapshot
Snapshot היא פעולה מיידית שקיימת במספר מערכות הפעלה אשר מספקות תמונה מוקפאת של הקבצים בנקודת זמן ספציפית. אחת הדרכים לגיבוי מידע חי היא סגירה זמנית של כל הקבצים הפתוחים, יצירת snapshot ופתיחה מחודשת של הקבצים שהיו פתוחים. כעת ניתן לגבות את ה-snapshot בצורה רגילה. יש לציין כי למרות שצורת עבודה זאת עובדת, היא אינה יעילה לגיבוי מידע חי.

גיבוי קובץ פתוח - נעילת קבצים
תוכנות גיבוי רבות מאפשרות לגבות קבצים פתוחים ע"י כך שהן מסמנות את הקבצים הפתוחים ומנסות לגבות אותם שוב מאוחר יותר.

גיבוי בסיס-נתוני "קר"
במהלך גיבוי זה בסיס הנתונים נסגר או ננעל ואינו זמין למשתמשים. כל הקבצים של בסיס הנתונים נותרים ללא שינוי ומגובים, כך שלאחר שיחזור אין בעייה מכיוון שכל חלקי בסיס הנתונים מסונכרנים.

גיבוי בסיס-נתוני "חם"
חלק ממערכות ניהול בסיסי נתונים מאפשרות ליצור גיבוי תוך כדי שבסיס הנתונים פתוח ובשימוש. בדרך כלל נוצר העתק לא מסונכרן של קבצי הנתונים ורשימה של שינויים שנעשו בזמן הגיבוי. כשמתבצע שיחזור, השינויים מהרשימה מוטמעים באופן אוטומטי בקבצי הנתונים וכך נוצר העתק מדוייק של בסיס הנתונים.

גיבוי מידע שאינו בקובץ

לא כל המידע במחשב שמור בקבצים וכדי לשחזר מערכת שלמה יש צורך לגבות גם מידע זה.

תאור מערכת - System description
מפרט מדויק של המערכת דרוש כדי לרכוש מערכת תחליפית זהה לאחר אסון.

מידע על קבצים - File metadata
לכל קובץ יש מאפיינים כגון הרשאות, סטטוס ותאריכים אשר יש צורך לגבות כדי לשחזר את סביבת העבודה המקורית.

תצורת partition
התצורה המקורית של הדיסק וצורת החלוקה ל-partitions דרושה כדי ליצור מחדש את מערכות הקבצים (file systems).

סקטור האיתחול - Boot sector
אף מערכת לא תתחיל ללא מידע זה וחובה לגבותו כדי לשחזר מערכת שלמה למצבה המקורי. אם לא נעשה שינוי ספציפי במידע זה, מערכת ההפעלה תדאג לייצר אותו בעצמה.

שימוש במידע המגובה

לרוב יש תועלת בשימוש ושינוי המידע המגובה כדי לייעל את תהליך הגיבוי. שינויים אלו יכולים לשפר את מהירות הגיבוי, מהירות השיחזור, אבטחת המידע והשימוש במדיה.

דחיסה - Compression
קיימות שיטות שונות המכווצות את הגודל של המידע אותו צריך לגבות כדי לעשות שימוש בנפח איחסון קטן יותר.

בדיקת כפילויות - De-duplication
כשמערכות דומות רבות מגובות לאותו התקן איחסון, קיימת אפשרות של כפילות רבה של מידע. לדוגמא, אם 20 תחנות עבודה הפועלות עם מערכת הפעלה של חלונות מגובות לאותו שרת, חלק גדול ממערכת ההפעלה יגובה 20 פעמים. כל שדרוש הוא גיבוי בודד של החלק המשותף כדי שניתן יהיה לשחזר ממנו את המידע לכל 20 התחנות.

הצפנה - Encryption
מדיית איחסון ניידת, כגון קלטת מגנטית, מהווה סיכון מבחינת אבטחת מידע אם היא נאבדת או נגנבת. הצפנת המידע יכולה להקטין את הסיכון אולם תהליך זה דורש משאבים ניכרים מהמחשב ולכן מהירות הגיבוי תרד.

מידרוג - Staging
לעיתים יש צורך לגבות את המידע לדיסק ביניים ורק אז להעתיקו מדיסק הביניים לסרט המגנטי. תהליך זה יכול לפתור בעייה של התאמת מהירויות בין המערכת המגובה לבין התקן איחסון הגיבוי, כמו שלעיתים קורה בגיבוי של רשת מחשבים.

ניהול תהליך הגיבוי

חשוב להבין שגיבוי הוא תהליך מתמשך. כל עוד נוצר מידע חדש ונערכים שינויים במידע קיים, גיבויים צריכים להתעדכן. אנשים פרטיים עם מחשב אחד ואירגונים גדולים עם עשרות אלפי מערכות הם בעלי צורך קבוע להגן על המידע. למרות שסדר הגודל שונה, המטרות והמגבלות של גיבוי המידע זהים וכולם צריכים לדעת אם הגיבוי הצליח או לא.

מטרות

Recovery Point Objective - RPO
הנקודה בזמן שהמערכת המשוחזרת תשקף. המצב הרצוי הוא שה-RPO יהיה בדיוק ברגע שקדם לאירוע אובדן המידע. ע"י ביצוע גיבויים בתדירות גבוהה יותר ניתן להתקרב למצב הרצוי.

Recovery Time Objective - RTO
הזמן שעובר בין האסון לבין שיחזור המידע וחזרה לפעילות נורמלית.

אבטחת מידע - Data security
בנוסף לאיפשור הגישה למידע ע"י בעלי המידע, חובה להגביל את הגישה הלא מאושרת למידע. גיבוי צריך להעשות בצורה שלא תסכן את המידע וניתן להשיג זאת ע"י הצפנת המידע (encryption) וטיפול נכון במדיות עליהן מאוחסן הגיבוי.

הגבלות

השפעות על המערכת
לכל צורת גיבוי נתונים שתיבחר קיימות השפעות על המערכת המגובה. אם השפעה זאת משמעותית, הגיבוי צריך להיות מוגבל בזמן לחלון זמן שאינו מפריע לפעילות השותפת של המערכת.

עלות החומרה, התוכנה והעבודה
לכל צורת איחסון יש עלות המושפעת מנפח האיחסון. התאמת נפח האיחסון הדרוש (לאורך זמן) לצרכי הגיבוי היא חלק חשוב בתיכנון מנגנון הגיבוי. לכל צורת גיבוי יש עלות של עבודה ולשיטות מסוימות עלויות העבודה גבוהות עד מאוד. עלות תוכנת הגיבוי גם צריכה להילקח בחשבון כי תוכנות מסוימות לצרכי גיבוי מיוחדים עולות הרבה יותר מתוכנות הגיבוי הסטנדרטיות.

רוחב-פס ברשת הנתונים
מערכות גיבוי מבוזרות יכולות להיות מושפעות מרוחב-פס מוגבל ברשת הנתונים האירגונית והחיצונית.

הטמעה

השגת המטרות תוך כדי התמודדות עם המגבלות יכולה להיות משימה קשה אשר הכלים והעקרונות המובאים יכולים לעזור בהשגתה.

תיזמון - Scheduling
שימוש בתיזמון אוטומטי יכול לשפר בהרבה את אמינות ואחידות הגיבויים ע"י ניטרול הגורם האנושי. תוכנות גיבוי נתונים רבות מכילות פונקציה של תיזמון מראש.

אימות זהות משתמש - Authentication
כדי לגבות מידע, יש לאפשר למתפעל תוכנת הגיבוי גישה חופשית לכל המידע והנתונים אותם רוצים לגבות. גישה כזאת היא בלתי מוגבלת למידע ויש להגבילה רק לאנשים המאושרים לעשות כן. מערכת המזהה ומאמתת את המשתמש צריכה להיות בשימוש כדי למנוע מאנשים שאינם מאושרים מלגנוב את המידע ע"י שינוי תצורת הגיבוי.

ניטור תהליך הגיבוי - Measuring the process
כדי לוודא שמנגנון הגיבוי עובד כצפוי, התהליך צריך לכלול כלים המנטרים נקודות מפתח ושומרים את היסטוריית הפעולות.

אימות גיבוי - Backup validation
התהליך שבאמצעותו יכול בעל המידע לקבל משוב על הצלחת גיבוי המידע.

דיווח - Reporting
במערכי גיבוי גדולים, דוחו"ת שימושיים כדי לנטר את השימוש במדיה, סטטוס ההתקנים, טעויות, אזהרות ומידע נוסף לגבי תהליך הגיבוי.

תיעוד - Logging
בנוסף לשמירה של דוחו"ת עבר, רשימה ממוחשבת של פעולות ושינויים גם היא שימושית כדי לנטר את אירועי מערכת הגיבוי.

עצות שימושיות כלליות לגיבוי מידע

  • ככל שחשיבות המידע גדולה יותר, כך גם הנחיצות לגבות מידע זה
  • רמת השימושיות של המידע תלויה באסטרטגיית השיחזור
  • איחסון הגיבוי ליד המידע המקורי אינו מומלץ מכיוון שאסונות כגון אש או הצפה יזיקו לגיבוי באותה מידה כמו שיזיקו למידע המקורי
  • מומלץ לעשות שימוש בתיזמון גיבוי אוטומטי כדי לצמצם את האפשרות של טעות אנוש

אם עדיין אין לכם מדיניות גיבוי מוסדרת, או שאתם מעוניינים בדעה נוספת על מערכת גיבוי המידע שלכם, אנא צרו עימנו קשר.


לפרטים נוספים לחצו על הקישור המתאים:


אשמח לעמוד לרשותכם, לענות על שאלות, לתת יעוץ ראשוני בלתי מחייב
ולשמוע מה יש לכם לאמר לי בכל עניין.

אתם מוזמנים לפנות אלי במייל (yair@yairweissman.com)
או בטלפון נייד: 0544-301265

יאיר