פרק 1 : הבסיס
· מהי HTML ?
· ה-web
איננו ה-Internet
· S‘URL
· התפתחותה של השפה
מהי HTML ?
HTML
איננה שפת תכנות רגילה כי אם שפת סימון אשר משמשת ליצירת מסמכים שניתן להעלות
לצפיה בדפדפן. HTML לא
מאפשרת לייצור תכניות מחשב שמבצעות חישובים ופועלות על פי אלגוריתם בדומה לשפות
התכנות האחרות. לא ניתן באמצעות HTML לכתוב תכנית שתכלול בתוכה משפטי בקרה (לולאה ומשפטי תנאי, למשל),
פונקציות שמוגדרות מראש על ידי המתכנת או פעולות בסיסיות אחרות אשר ניתן לבצע בכל
שפת תכנות מקובלת (C, PASCAL
ואחרות). ראוי לציין כי HTML הינה אחת השפות השימושיות ביותר ליצירת אתרים באינטרנט (אם לא
השימושית מכולן).
באמצעות
שפה זו ניתן לייצור דפים אשר ניתן יהיה לצפות בהם באמצעות כל אחד מהדפדפנים
הקיימים.
ראשי
התיבות של HTML
הן:
Hyper Text Markup Language
כלומר,
זוהי
שפה שכוללת מילות סימון. תפקידן של מילות הסימון הוא לקבוע את האופן שבו יוצג
הטקסט אשר כתוב בדף HTML בדפדפן. דף HTML הוא קובץ טקסט פשוט אשר כולל בנוסף לטקסט שמוצג בדפדפן, גם מלים
מיוחדות. תפקידן של המלים במיוחדות הוא להורות על אופן הצגת הטקסט, וכמו כן, להורות
על שילובם של רכיבים ויזואליים ורכיבים פונקציונליים אחרים בדף שנצפה באמצעות
הדפדפן.
חשוב
לציין כי שפת ה-HTML
איננה מוגבלת למערכת הפעלה כלשהי. זוהי שפת סימון שניתן להשתמש בה במגוון רחב
ביותר של מערכות הפעלה. עם זאת, בין הדפדפנים לא קיימת אחידות. קיימות מספר פעולות
ב-HTML
שיגרמו לתצוגה שונה בדפדפנים שונים. כמו כן, קיימות גם מספר פעולות שנתמכות רק על
ידי חלק מהדפדפנים.
ה-WEB איננו ה-Internet
אחת
הבלבולים הגדולים ביותר שקיימים בקרב משתמשי האינטרנט הוא היעדר ההבחנה בין
האינטרנט לבין ה-World Wide Web.
האינטרנט
היא רשת בינלאומית של מחשבים שמחליפים מידע זה עם זה. הקמת האינטרנט החלה בשנות
ה-60 כפרוייקט של מחלקת ההגנה האמריקאית, ופרוטוקולי התקשורת שפותחו באמצע שנות
ה-60 משמשים גם כיום. רשת האינטרנט מורכבת משרתים (מחשבים שמספקים מידע) ולקוחות
(מחשבים אחרים שמבקשים ומקבלים מידע מהשרתים). כדי לחבר מחשב אל רשת האינטרנט יש
להתקין בו את הפרוטוקולTCP/IP (Transfer Control Protocol/Internet
Protocol), ולחברו אל ISP(InternetService Provider).
בשנות
ה-90 הופיע פרוטוקול אינטרנט חדש בשם HTTP (Hyper Text Transfer Protocol), וכך נוצרה רשת ה-www (World Wide Web).
זוהי רשת וירטואלית של מחשבים שבנוייה על בסיס רשת האינטרנט (מהווה חלק ממנה). רשת
זו כוללת שרתי HTTP
(מחשבים שפועלים על פי פרוטוקול ה-HTTP) ששולחים קבצים ברחבי האינטרנט, והיא נקראת גם בשם WEB.
חשוב
לזכור כי ה-WEB איננה
האינטרנט. ה-WEB
היא רק אחד השירותים שזמינים ברשת האינטרנט. שירותים נוספים שקיימים ברשת האינטרנט
כוללים, למשל, את שירות הדואר האלקטרוני (e-mail).
לאחר
יצירת דף ה-HTML יש
לפרסם אותו ב-WEB
כדי שגם אחרים יוכלו לצפות בו.
משמעות פרסומו של דף ה-HTML ב-WEB היא שמירתו בשרת HTTP שמחובר לאינטרנט. השרת שולח את דף ה-HTML לכל אחד מהלקוחות (מחשבים אחרים ברשת) שפונה אליו בבקשה לקבלו.
S‘URL
ראשי
התיבות של URL הן: Uniform
Resource Locator, ובעברית, תרגומן
הוא: מאתר משאבים אחיד. ה-URL הינו כתובת של דף HTML או של כל משאב אחר (קובץ, מנוע חיפיש...) שנמצא באינטרנט. כל URL
ייחודי, ומתאר באופן חד ערכי משאב אחד מסוים.
דוגמא
ל-URL
יכולה לשמש כל אחת מכתובות האתרים השונים שקיימים ברשת האינטרנט, לדוגמא: http://www.zindell.com.
URL לדוגמא: http://www.zindell.com/demos/index.html
את
ה-URL
ניתן לפרק למספר חלקים:
בחלקו
הראשון יירשם פרוטוקול התקשורת. בדוגמא זו: http
ואחרי
הסימן המפריד :// יבוא חלקו
השני, שם המחשב. בדוגמה זו: www.zindell.com
אחרי
שמו של המחשב יבוא הסימן המפריד
/ ואחריו יבוא חלקו השלישי,
שמו הספציפי של המקור (יכול להיות שם של קובץ אך לא בהכרח). בדוגמא זו: הקובץ index.html
אשר נמצא בתת הספריה demos. נהוג לקרוא לחלק השלישי בשם file
component למרות שהוא לא חייב
להיות, בהכרח, שם של קובץ.
בתוך
ה-URL
ניתן לציין את מספר ה-port שעימו יבוצע הקשר. אם לא מציינים את מספר ה-port אז מספר ה-port שאליו ייעשה החיבור יהיה עפ"י הפרוטוקול (לדוגמא, מספר ה-port
שמהווה ברירת מחדל בפרוטוקול http הוא 8080). ציון מספר ה-port נעשה באמצעות הוספת נקודותיים מפרידות אחרי שם המחשב ומייד אחריהן
את מספר ה-port
המבוקש. לדוגמא:
http://www.zindel.com:8080/demos/index
אל
סופו של ה-URL
ניתן להוסיף עוגן (anchor) אשר מהווה reference למיקום מסוים במסמך שאליו ה-URL מכוון. העוגן (anchor)
נכתב אחרי ה-URL
כשביניהם הסימן המפריד: #. לדוגמא:
http://www.zindell.com/demos/index.html#chapter1
העוגן
(ה-anchor)
איננו חלק רשמי מה-URL,
והוא יגרום לכך שעם העלאתו של מסמך ה-html הדפדפן יעבור אל אותו מיקום ספציפי במסמך שסומן
בתגית chapter1 (כהמשך לדוגמא).
בתכנית
ניתן גם לעשות שימוש ב-URL יחסי. URL יחסי הוא URL אשר לא כולל את כל הרכיבים המקובלים. ניתן להשמיט את כל אחד
מהרכיבים למעט ה- file component.
במקרה כזה, כל אחד מהרכיבים שהושמטו יקבל את הערך שיש ל-URL המלא אשר מתאר את המקום שבו התכנית פועלת. URL יחסיים שימושיים בעיקר בתוך מסמכי HTML. יש לשים לב לכך, שהאמור לעיל איננו מתייחס לעוגן, כיוון שהוא לא
נחשב לחלק מה-URL.
לדוגמא,
בתוך המסמך שאליו הפנה ה-URL מהדוגמא הקודמת ניתן למקם URL יחסי כדוגמת:
info.html, והמשמעות לכך תהיה הפניה למסמך HTML
ששמו info.html,
אשר נמצא גם הוא בספריה demos.
מתוך
שטח הזיכרון שנמצא בשרת, ומשמש לאחסון אתר ניתן להקצות שטחי זיכרון שישמשו בתור שטחי זיכרון משניים שישמשו לאיחסונם
של אתרי משנה לאתר העיקרי. לשטחים אלה קוראים בשם חשבונות. שמו של חשבון מתחיל
בסימן ~, והפנייה אליו נעשית תוך ציון ה-URL של האתר העיקרי, ובסופו שם החשבון שאליו מעונינים לגשת (בין שם
החשבון ל-URL)
יש למקם אלכסון. לדוגמא:
בעוד
שבמתן שם ל-URL
אין רגישות להבדלים בין אותיות גדולות לאותיות קטנות, הרגישות הזו כן קיימת במתן
שם לחשבון, ולכך יש לשים לב.
התפתחותה של השפה
שפת ה-HTML
שייכת לקבוצה של שפות סימון שנקראת בשם SGML. ראשי התיבות של SGML הן: Standard Generalized Markup
Language. לכל שפה ששייכת ל-SGML יש
DTD (Document Type
Definition). ה-DTD
כולל בתוכו הגדרה מסודרת של הפקודות וההוראות שבהן ניתן להשתמש. גם ל-HTML מוגדר DTD.
W3C (http://www.w3c.org) היא הקבוצה שאחראית להתפתחותה של שפת ה-HTML הרישמית. קבוצה זו פועלת בשיתוף פעולה עם חברות המחשבים והתוכנה
בפיתוח השפה.
לאורך
השנים הופיעו גרסאות רבות לשפת ה-HTML:
HTML
כיום,
מעט מאד אנשים משתמשים בגרסא הזו.
HTML+
הופיעה
ב-1993.
HTML2.0
הופיעה
ביולי 1994, וקיבלה אישור מטעם ה-IETF בחודש נובמבר של אותה שנה. ה-IETF הוא ארגון בינלאומי אשר אחראי שם לנגד עיניו את התפתחותה של רשת
האינטרנט. החברים בארגון זה נפגשים שלוש פעמים בשנה, ועיקר עבודתם נעשית באמצעות
ה-
e-mail.
HTML3.0
גרסה
זו נתמכה על ידי שני הדפדפנים הפופולריים (IE ו- Netscape Nevigator) באופן חלקי בלבד.
HTML3.2
גרסה
זו נתמכה באופן כמעט מלא על ידי שני הדפדפנים. הודות לגרסה זו צברה HTML
פופולריות רבה נוספת.
HTML4.0
זוהי
הגרסה העדכנית ביותר (בעת כתיבת הספר). ההבדלים הבולטים בינה לבין HTM3.2 הוא השימוש ב-UNICODE ובגליון סגנונות.
2000
© All the rights reserved to Haim Michael & Zindell Publishing House Ltd.
No parts of the contents of this paper may be reproduced or transmitted in any form by any means
without the written permission of the publisher ! This book can be used for personal use only !!!
Brought
to you by Zindell
(http://www.zindell.com)