על אבטחת הבלוג וההרחקה מגוגל
27 בApril, 2008 | מאת Tzahi Hararyשלום לכל מליוני הקוראים….
שילוב של עומס עבודה, חופשת מחלה קצרה, חופשת פסח קצרה עוד יותר אך בעיקר ניסיונות חוזרים ונשנים של גורמים עויינים להשחית את הבלוג מנעו ממני לכתוב ברצינות כמעט חודשיים. זה לא בגלל שאין לי מה לכתוב או במה לשתף, ההיפך – יש המון טיוטות שמחכות לגימור ולפרסום ועוד המון מידע שהייתי שמח לחלוק, אבל ההתעסקות עם אבטחת ושחזור הבלוג גזלו ממני את זמן הכתיבה.
בכלל בתקופה האחרונה חלה עליה חדה ומשמעותית במספר ההתקפות של זבלנים על טפסים באתרים (יצירת קשר, תגובות, פורומים וכו’), זה כבר נהיה ממש בלתי נסבל. הבעיה הגדולה היא שחברות האחסון וספקיות האינטרנט מגיבות (ובצדק, כמובן) ומשנות את תצורות השרתים והשירותים, ומשימות שהיו פשוטות לביצוע (טופס יצירת קשר, לדוגמא) הופכות להיות מסובכות הרבה יותר (אימות כפול ומכופל מול שרת הדואר), זה מרגיש כאילו כמה עבריינים השתלטו על השכונה השקטה והפכו אותה למקום לא נעים לגור בו…
כמה עדכונים לגבי שינויים שנעשו בבלוג וכמה טיפים לאבטחת וורדפרס:
מה בעצם קרה?
לפי מה שקראתי בכל מיני פורומים ואתרים, הפורצים ניצלו את פירצה בממשק ה- XMLRPC של גירסה 2.3.2 של וורדפרס. ממשק זה מאפשר כתיבת פוסטים מרחוק (אימייל, תוכנות יעודיות וכו’) ובאמצעותו הוסיפו אלפי קישורי ספאם (בעיקר לקזינו) לפוסטים קיימים המאונדקסים בגוגל במטרה להיכנס עם תוכן פסול לתוצאות החיפוש על גב תוכן מקורי שגוגל “אהב” ואינדקס.
לחלק מהפוסטים הוסיפו הפורצים את הטקסט כטקסט נסתר (שזו גם חריגה מהנחיות גוגל למנהלי אתרים) – מה שהקשה על איתורו, הפוסט הוצג בבלוג כרגיל ללא קישורי הספאם, אך מנוע החיפוש המנטרל את הגדרות העיצוב סרק אותו כטקסט רגיל.
הפיתרון:
במקרה הזה הפיתרון היה להיכנס ידנית לכל פוסט, להציג אותו בתצוגת קוד HTML ולמחוק את כל קישורי הקזינו, זה היה במקרה הטוב!
במקרה הפחות טוב הפורצים פשוט החליפו את תוכן הפוסט בקישורי זבל והשאירו רק את הכותרת והקישור כפי שהיו. במקרה זה נאלצתי לשחזר את הפוסטים האבודים מהמטמון של גוגל, יאהו ולייב, את הפוסט האחרון שפורסם יום לפני הפריצה לא הספיקו מנועי החיפוש לאנדקס והוא אבד, חבל, זה דווקא היה מדריך נחמד על איך לעצב את הדף האישי במייספייס (דוגמא: ההרכב המדהים טרייבל דאנס ישראל) בהזדמנות אשחזר אותו.
השינויים בבלוג:
לאחר שדרוג ל- 2.3.3 ומיד אח”כ ל- 2.5 חשתי בטוח, אך לפני כשבועיים כשסוף סוף מצאתי קצת זמן לשבת לכתוב, גיליתי ששוב מילאו כמה פוסטים בקישורי הזבל ושוב נאלצתי לנקות אחרי הזבלנים. הפעם נקטתי בכמה אמצעי מניעה שאני מקווה שיעזרו:
- עדכנתי לגירסאות האחרונות של וורדפרס ושל כל התוספים המותקנים בבלוג
- ביטלתי את אפשרות פרסום הפוסטים באמצעות האימייל
- הגדרתי לו”ז לגיבוי אוטומטי של מסד הנתונים
- התקנתי תוסף (DigoWatchWP) המודיע לי באמצעות האימייל בכל פעם שמתבצע שינוי בתכנים
- הסרתי את שלל התוספים שהתקנתי בעבר כניסיון ושמאז נשארו ללא שימוש
- ומעכשיו חייבים להרשם בכדי להגיב, מצטער, אבל זה כבר היה הכרח עקב כמויות הזבל.
על הדרך עשיתי כמה שינויים ויזואליים יותר לכם, הקוראים:
- החלפתי את ערכת העיצוב בערכה ללא עיצוב כמעט, אך עם הרבה מקום וכבוד לתוכן
- חידשתי את האפשרות לגירסת הדפסה ושליחה לחבר (בעדכון של התוסף נמחק לי התרגום, סליחה).
- החלפתי את הפלאג-אין של “כתבות קשורות” המציג קישורים לכתבות דומות בסוף כל כתבה לאחד שאמור לעשות עבודה טובה ומדוייקת יותר (Similar Posts), האם הוא יעמוד במשימה? נחיה ונראה.
- הוספתי תוסף המעדכן באימייל את כל מי שרשום לאתר על כל פוסט חדש
- בתחום השלמת ההכנסה – נשארתי רק עם אדסנס, שאר הרשתות הישראליות קיבלו ממני מאות אלפי חשיפות והחזירו בתמורה רק אגורות בודדות…
- הוספתי באנר גרפי אחד לאתרים שלי: דוכנים ו- ירידים – לא מכירים? כנסו ובקרו, אתרים נגישים רמה 1, תקניים (חוץ מהקוד של הפרסומות) ותופתעו לגלות כמה סוגי דוכנים וכמה ירידים יש בארצנו הקטנטונת….
הרחקה מהאינדקס של גוגל:
אחרי כל זה, חשבתי שאפשר לנוח או לפחות לפנות זמן לכתיבה, אך פתאום קיבלתי אימייל מ- Google Search Quality שזה הסיוט של כל בעל אתר עם הנושא המפחיד: Removal from Google’s index
שזה אומר שהבלוג מוצא מהאינדקס של גוגל לפחות ל- 30 ימים הבאים במהלכם עלי לבצע כמה פעולות הכרחיות על מנת שאוכל לחזור לאינדקס.
יש לציין שהחבר’ה בגוגל ציינו את המניע להוצאת האתר מהאינדקס – we detected that some of your pages were using techniques that are outside our quality guidelines
הבהירו שלא אני החשוד בחריגה מהנהלים: This appears to be because your site has been modified by a third party
הציגו הוכחה – The following is some example hidden text we found at http://me.sml.co.il/:
(כאן הובא הטקסט המכיל את קישורי הקזינו). ולבסוף הציעו דרכים לשיפור אבטחת האתר מהבלוג הרשמי של גוגל למנהלי האתרים ועוד כמה טיפים וסדר פעולות אותן צריך לבצע מי שניזוק מזבלנים שפרצו לו לאתר.
וגם אפשרות להחזיר את האתר לאינדקס לאחר מילוי ההוראות הנ”ל.
מה הלאה:
התחלתי במשימה עם תקווה בלב, אך גם עם מועקה משום שרוב הפוסטים שאני כותב הם בנושאים יחודיים שאין להם (לפחות ככל הידוע לי) מקבילים בעברית, אני משתדל לא למחזר חומרים או לכתוב על משהו שמישהו אחר כבר כתב, ואין דבר יותר מעצבן מאובדן משהו שיצרת מאפס והשקעת בו שעות רבות של לימוד, מחשבה, ניסיון וכתיבה ופתאום באים האנשים הרעים שבאינטרנט והורסים לך את זה – כתיבת מדריך מפורט אורכת כ- 4 שעות, וזה לא כולל את השעות הרבות שמושקעות בלימוד הנושא לעומק.
אז אם למי מהקוראים יש רעיון או ניסיון רב יותר בהגנה על בלוגים מבוססי וורדפרס – אשמח לשמוע וליישם.
תודה,
צחי.


6 תגובות עבור “על אבטחת הבלוג וההרחקה מגוגל”
מאת Xslf בתאריך 27 בApril, 2008 | תגובה
אויש, זה נשמע סיפור מבאס. יש לך גיבוי של הפוסטים הישנים?
מאת צחי הררי בתאריך 27 בApril, 2008 | תגובה
אכן, מאד מבאס. לפוסטים האחרונים לא היה לי גיבוי, אך כאמור הצלחתי לשחזר אותם ממטמון מנועי החיפוש (אלוהים יברך אותם) חוץ מהמדריך לעיצוב דף ה-MySpace שאכתוב אותו מחדש בקרוב.
עכשיו כבר הפעלתי את אופציית הגיבויים האוטומטיים באמצעות הפלאג-אין של וורדפרס.
פעם הצלחתי לעצור התקפה של תגובות זבל ע”י החזרת שגיאה 404 לרובוט המזיק, אני אנסה לעלות על מקורות התנועה של המזיקים הנוכחיים ולפעול נגדם באותה דרך, אולי אז ירדו ממני.
אבל הדבר שהכי מבאס הוא שהרעים כופים עלי לבזבז זמן יקר בהתעסקות בשיחזורים והגנות במקום בעבודה, לימוד דברים חדשים והמשך פיתוח.
מאת צפריר בתאריך 27 בApril, 2008 | תגובה
רק צריך לעדכן גירסה מיד כשיוצאת. להחזיק אתר באינטרנט בגירסה ישנה שיש לה פריצות מוכרות זו הפקרות לשמה, וטכנורטי גם לא מאנדקס גרסאות ישנות של וורדפרס, אז זו עוד סיבה.
מאת 077 בתאריך 1 בMay, 2008 | תגובה
למה אתה לא מפעיל CAPTCHA באתר ? זה יעזור למנוע 99% מהספאם.
מאת צחי הררי בתאריך 2 בMay, 2008 | תגובה
צפריר, אתה צודק, אבל כשמתחזקים כ- 10 אתרי וורדפרס (שלי ושל לקוחות) שלא כולם יושבים על אותו שרת, מספיק יום אחד שבו מתפרסמת הודעה על פירצת אבטחה ועד שאני מספיק לעדכן את כל המערכות כבר מתבצעת פריצה.
כמובן שבפעם הזו פורצים דווקא אלי, כי קודם אני מעדכן את אתרי הלקוחות ואת עדכוני האתרים שלי אני משאיר לסוף.
זה לא קורה כל הזמן, למען האמת זו היתה הפעם הראשונה (נקווה שגם אחרונה) שפרצו לי לאתר. אני עובד עם וורדפרס כבר שנתיים וחוץ מבעיות של ספאם שאקיזמט פתר – לא היו לי בעיות.
077 – נכון שזה פותר את הבעיה, אבל נראה לי קצת אבסורד להשתמש ב- Captcha באתר שעוסק בין השאר בנגישות ושימושיות….
אבל רשמתי לי לשאול את אמיר דותן אם 2+2 שווים 0 ספאם.