דותן הלוי

היוצאים והבאים בשערי ארכיונים וספריות בשנים האחרונות מזהים כי שינוי חשוב מתחולל באופן בו אנו צורכים מידע כתוב. כתוצאה מדיגיטציה של יותר ויותר חומרים היסטוריים, מתחדשים פני הספריות והארכיונים, שיטות העבודה בהם משתנות, וכך גם החומרים עצמם. אולם בעוד המתודולוגיה ההיסטורית למדה עם השנים להתייחס למוסדות הארכיון והספריה באופן ביקורתי, הרי שתהליך הדיגיטציה, המהותי כל כך לעיסוק המחקרי, נותר עד כה שקוף עבורה. יש לכך סיבות טובות: דיגיטציה מתבצעת בדרך כלל הרחק מעיניהם של החוקרים ובאמצעות כלים הרחוקים מתחום מומחיותם. בה בשעה נראית העבודה עם מאגרים אלקטרונים כטומנת בחובה יתרונות בלבד. על יתרונות אלה ניתן למנות את המהירות באיתור מסמכים על פי מילות חיפוש, את הנגישות הגבוהה של החומרים ובמקרה של מסמכים מודפסים – גם את היכולת לבצע חיפוש בגוף המסמך על ידי טכנולוגית OCR (Optical Character Recognition). אולם גם הנחות אלו טעונות בדיקה וביקורת. ברשימה זו אבקש לדון בקצרה במאפייניו של המסמך הדיגיטלי ושל התהליך בו הוא הופך לכזה. אטען כי לצד היתרונות הברורים, עשוי תהליך הדיגיטציה להביא גם לפגיעה ביכולתם של החוקר והחוקרת לשחזר בצורה מיטבית את הקונטקסט של המסמכים בהם הם עוסקים.

ראשית, יש לבחון את תהליך הדיגיטציה בכלי ביקורת הארכיון הקיימים, ובחשד בריא שפיתחו חוקרים כלפי מניעי המוסדות והכוחות העומדים מאחוריו. עצם הוצאת תהליך הדיגיטציה לפועל מלווה לעתים בחידוש כללי של שיטת העבודה בארכיון ובבחינה מחודשת של החומרים הנחשפים לעיני הציבור. היות והגישה הישירה אל החומרים הסרוקים בארכיון מדלגת מעל פונקציית הארכיבר, האחרון כבר לא יכול לשמש כמסננת אד-הוק של חומרים. ויחד עם החשש מפני חוסר שליטה על תפוצתו של חומר דיגיטלי, עלולים ארכיונים להגביל את החומר הסרוק מלכתחילה. ביצירת קטלוג דיגיטלי למאגר הסרוק, כותרות מסמכים שלא נסרקו עלולים, בניגוד לעבר, שלא להופיע כעת בקטלוג כלל ועיקר, וכך החוקר אף לא ידע מלכתחילה על קיומם.

ארגזים של מסמכים בארכיון המדינה. צילום: מיכל פתאל

חיסרון מהותי נוסף טמון באופן ה"קר" בו נפגש החוקר עם החומר הדיגיטלי, המוצג כעת על מסך מחשב. עבור העוסקים בהיסטוריה תרבותית ככלל ובוודאי עבור העוסקים בהיסטוריה של טקסטים או של שימוש בהם, למפגש בלתי אמצעי עם המסמך עשויה להיות חשיבות רבה לניתוח המחקרי. המגע של ההיסטוריון עם מסמכיו הוא רב חושי. בקריאת מסמך דרך מסך המחשב החוקר לא חווה את המגע או את הריח שלו, ואפילו האופן בו קולט חוש הראיה את המסמך הוא מוגבל, שכן מסך המחשב מעוות את  גודלו המקורי של המסמך ואת גווניו. כך למשל אובד הפורמט של המסמך החשוב לחוקר להבנת אופן השימוש בו, בין אם היה זה פתק שהועבר מיד ליד, תעודת מסע מתקפלת או עצומה שניתן לגלול.  אם להשתמש במונח שטבע וולטר בנימין בהקשר של שעתוק טכני מוקדם יותר, הרי שהמסמך מאבד כך את ה"חד פעמיות" שלו. כמו ביצירת אומנות- אותה "הילה" או "חד פעמיות" מאפשרת להבין את המסמך לא רק על פי תכניו אלא גם על פי התחושה שהוא מעורר. בנימין אף קובע כי המפגש עם היצירה המשועתקת, מנתקת את אותה "חד פעמיות" והופכת אותה לבת זמנו של המתבונן. תובנה זו מתאימה גם לעבודה עם חומרים היסטוריים, שכן הרושם שמסמך מקורי יוצר מאפשר לחוקר לחוות ולו במעט את הרגע ההיסטורי בו נעשה במסמך שימוש. העיבוד הממוחשב של מסמך "משטיח" אותו, משווה אותו עם מסמכים אחרים, ומביא את המסמך אל זמנו של החוקר במקום להיפך. אי היכולת לשחזר את חווית המשתמש במסמך עלולה לפגום בהבנתו של החוקר את המציאות ההיסטורית אותה הוא מנסה לשחזר. נכון אמנם שלעולם האחרון לא יוכל להיכנס לנעליהם של מושאי מחקרו, אבל דרושה לו לכל הפחות היכולת להזדהות איתם עד כמה שניתן.

אך גם אם נבקש לקבל באופן הישיר ביותר את המידע המוטבע, דיו על גבי נייר, במסמך מבלי להתעכב על חוויה החושית-רגשית שלו, נמצא כי תהליך הדיגיטציה עלול לעמוד בדרכנו. זאת מכיוון שארכיונים רבים בוחרים, מטעמי חסכון בזיכרון מחשב ומהירות הצגת המסמך באולם התצוגה, לסרוק את מסמכיהם בשחור לבן. בחירה זו מעלימה במודע חלקים מהחומר המקורי שנמצא במסמך. בתהליך הסריקה ממוינים הפיקסלים המרכיבים את המסמך המקורי בין האפשרויות שחור ולבן; אלו הקרובים בגוון לשחור כמו אפור כהה יתקבלו במסמך הסרוק כשחורים ואלו הקרובים ללבן, כמו אפור בהיר, יתקבלו כלבן. התוצאה תהיה מסמך פקסימיליה נקי, בו נשמר כביכול "העיקר". אולם סימנים דהויים על המסמך המקורי כמו כתמים, הערות בעיפרון, חותמות וכדומה – אם יהיו מתחת ל-50 אחוז בהירות – ייעלמו מהמסמך הסרוק והקורא אף לא ידע לעולם על קיומם. יש בכך כדי להעלים מידע קונטקסטואלי שעשוי להיות מהותי להבנת המסמך. האבסורד הגדול הוא שבעוד ארכיברים מסורים עמלים במשך שנים על שימורם של מסמכים מתפוררים, דווקא הזינוק הטכנולוגי קדימה מעלה את מאמציהם בתוהו. בעיתיות זו תקפה, יש לומר, בעיקר ביחס למסמכים במובן הקלאסי של המילה- מכתבים, טפסים או פתקאות. היחס לתמונות, מפות, כתבי יד או מסמכים מונומנטליים הוא אחר, ואלה נסרקים לרוב בגווני אפור או בצבע, מה שעושה אותם יותר כבדים על מערכת ממוחשבת. ספרים שלמים גם הם נסרקים  באופן שונה.

דיגיטציה של כתב יד

בעיית היעלמות המידע ממסמכים היסטוריים מסיבות טכנולוגיות היא סימפטום של תופעה רחבה יותר. בבסיס העניין עומדת העובדה כי רוב עבודות הסריקה של מסמכים כלל לא נעשות על ידי ארכיונים או ספריות. אלו מתבצעות על ידי חברות פרטיות המתמחות בסריקה מהירה ויעילה של מאות אלפי מסמכים ליום באופנים שונים, בהתאם לסוג המסמך. ארכיונים וספריות הם רק חלק ממגוון לקוחותיהן של חברות הדיגיטציה, המשרתות בשגרה כמעט כל מוסד שמחזיק נייר. משרדי הממשלה, משרדי עורכי דין, בנקים וחברות עסקיות מעבירים כולם את המסמכים שלהם באופן שוטף דיגיטציה ובחלק מהמקרים משמידים לאחר מכן את המסמכים המקוריים. תהליך זה נועד לחסוך במרחבי אחסון, להעביר את המסמכים סריקת OCR שתאפשר לאחר מכן חיפוש ממוחשב בתוכם ואף מאפשר "לחתום" אותם בגרסה סופית כך שיוכלו לשמש עדות קבילה בבית משפט. אולם מה שטוב עבור מסמכים עכשוויים אינו בהכרח מספיק עבור מסמכים היסטוריים. בעת סריקה של חומר ארכיוני ישן עלולות חברות הדיגיטציה לפספס ניואנסים שעשויים להיות רבי משמעות עבור החוקרת או החוקר. עוד עולה מכאן כי בעתיד הלא רחוק, מסמכים ממשלתיים ואחרים יועברו לארכיון מלכתחילה בגרסתם הדיגיטלית כך שהמגע בארכיון עם מסמך קשיח למעשה יעלם לחלוטין. אין בכך, אגב, כדי לומר שתהליכי דיגיטציה מובילים אותנו לעולם נטול נייר, ככל הנראה דווקא ההפך הוא הנכון. כל עוד לחתימה הידנית תוקף משפטי, טפסים ימשיכו להיות מודפסים. אלא שבעוד מערכות בירוקרטיות בעבר שינעו טפסים קשיחים בין פקידים על מנת לאסוף את חתימותיהם, כיום ריבוי עמדות ההדפסה מאפשרות שטפסים יעברו ברשת בין פקידים כאשר כל אחד מהם מדפיס-חותם-סורק וחוזר חלילה.   

ניתן כמובן לטעון כי באספם חומר יוצאים החוקר והחוקרת ממילא מתוך ההנחה שהם חשופים רק לחלקים מצומצמים מתוך העדות ההיסטורית. לכן, ממאי נפשך? אלא שבדיוק בשביל לאפשר ניתוח מעמיק של אותה עדות היסטורית שנותרה, אין להחליף באופן מלא את המסמך המקורי עם ייצוגו הדיגיטלי. על הארכיונים, על-כן, לאפשר למעוניינים בכך להגיע אל המסמכים המקוריים גם בעידן הדיגיטלי. חשוב מכך, על הארכיונים והספריות שמעבירים את מסמכיהם דיגיטציה לעשות זאת מתוך בחינה קפדנית של אופי המסמכים ואופן הסריקה ולשתף בתהליך חוקרים וחוקרות שיוכלו לסייע בהצבעה על הרגישויות בהן יש לטפל בחומרים היסטוריים. על החוקרים, מצדם, להיות נכונים לתרום מנסיונם ואף לראות בכך הזדמנות לבסס מערכת יחסים עתידית בריאה עם ארכיונים. במקביל, עליהם להיזהר שלא ליפול למלכודת הדבש שמציע עולם הידע הדיגיטלי. האפשרות הקוסמת לכתוב מאקרו היסטוריה דרך הפעלת מניפולציות סטטיסטיות על מילים וביטויים נוסח Google Ngram עשויה להוביל לכך שמסמכים היסטוריים רק יסרקו במקום שיקראו. הרגישות שפיתחה הדיסציפלינה ההיסטורית בעמל רב לשפה ולמשמעיותיה עשויה לכהות דווקא נוכח הנגישות הבלתי מוגבלת לטקסטים. לכן, כניסתו של ההיסטוריון אל תוך מערכת הטיפול במסמכים והעלאת המודעות לתהליכים שהם עוברים עשויות להביא לכך שלא יאבד בעיניו ערכו של המסמך הבודד. 

* דותן הלוי שוקד בימים אלה על כתיבת עבודת התזה שלו באוניברסיטת תל-אביב על העיר עזה בתקופת מלחמת העולם הראשונה

** מאמר זה הוא הרביעי בסדרת מאמרים שהתפרסמו במסגרת הסדנה להיסטוריה חברתית על ארכיונים והיסטוריונים במזרח התיכון. 

על "הפנים הכפולות של ארכיון מדינת ישראל" תוכלו לקרוא כאן

על "לקחים מן הארכיון העות'מאני החדש באיסטנבול" תוכלו לקרוא כאן

על "הארכיון המצרי כסיסמוגרף של ההווה המהפכני תוכלו לקרוא כאן

עקבו אחרינו בפייסבוק  כאן