HTML
(HyperText Markup Language)
Fájlkiterjesztés.html, .htm
MIME-típustext/html
FejlesztőWorld Wide Web Consortium & WHATWG
Kiadás dátuma1993
Formátum típusaJelölőnyelv
Kiterjesztése ennekSGML
Kiterjesztése ezXHTML
Mac OS típuskódTEXT
Uniformpublic.html
StandardISO/IEC 15445
W3C HTML 4.01
W3C HTML5 (draft)
Weboldalhtml.spec.whatwg.org/multipage/
Példa HTML kódra szintaxis kiemelésekkel és sorszámokkal

A HTML (angolul: HyperText Markup Language, „hiperszöveges jelölőnyelv”) egy leíró nyelv, melyet weboldalak készítéséhez fejlesztettek ki, és mára már internetes szabvánnyá vált a W3C (World Wide Web Consortium) támogatásával. Az aktuális változata az 5, mely az SGML általános jelölőnyelv egy konkrét alkalmazása (azaz minden 5-ös HTML dokumentum egyben az SGML dokumentumszabványnak is meg kell hogy feleljen). Ezt tervek szerint lassan kiszorította volna az XHTML, amely a szintén SGML alapú XML leíró nyelven alapul, de még csak kevés weboldal használja.

Használata

HTML általában szöveges állományokban található meg olyan számítógépeken, melyek az internethez kapcsolódnak. Ezek az állományok tartalmazzák azokat a szimbólumokat, amelyek a megjelenítő programnak leírják, hogyan is kell megjeleníteni illetve feldolgozni az adott állomány tartalmát. Megjelenítő program lehet egy webböngésző (angolul: web browser), aural böngésző (olyan, amelyik a felhasználónak felolvassa a megjelenítendő szöveget), braille olvasó, amely konvertálja a szöveget braille „formátumba”, levelező program (mint például: Mozilla Thunderbird, Microsoft Outlook, Eudora, Claws Mail stb.), valamint egyéb eszközök, például mobiltelefon.

Szimbólumok, tartalom

Négyfajta szimbólum (leíró elem) található meg a HTML-ben:

Felépítés

Egy HTML állomány három fő részre bontható:

  1. A Dokumentumtípus-definíció az állomány legelején, pl:
    <!DOCTYPE html>
  2. a HTML fejléc <head></head>, ami technikai és dokumentációs adatokat tartalmaz, amelyeket az internet böngésző nem jelenít meg, tehát átlag felhasználó ezeket nem látja és
  3. a HTML törzs <body></body>, amely a megjelenítendő információkat tartalmazza.

Tehát egy internetes oldal alapszerkezete a következőképpen nézhet ki:

  <!DOCTYPE html>
  <html>
    <head>
      <title>Fent lévő címsor</title>
      <!--esetleges további fejléc-információk-->
       <!--Itt fogjuk elkezdeni használni a CSS programnyelvet amiről bövebb információt találhatsz a wikipédián!-->
       <style>
            h1 {
            color: #478a9e;
            }
           
       </style>
    </head>
    <body>
      <h1> Hello Világ! </h1>
      <p> Üdvözöllek a weboldalon! </p>
    </body>
  </html>

Karakterkódolás

Egy HTML dokumentum alapértelmezésként ISO-8859-1, azaz nyugat-európai kódolást használ.[1] Gyakran előforduló hiba szokott lenni, hogy nincs beállítva a charset paraméter a fejléc content attribútumában, annak ellenére, hogy a dokumentum nem nyugat-európai kódolású szöveget tartalmaz. Magyar nyelvű oldalak esetén ilyenkor gyakran az „ő” és „ű” betűk helyett „õ” és „û” karaktereket látunk (ekkor valószínűleg "ISO-8859-2" vagy "windows-1250" volna a helyes charset érték), de az is lehet, hogy minden ékezetes betű teljesen olvashatatlanná válik, betűszemetet eredményezve (ha például a megjelenítendő szöveg UTF-8 kódolású). A charset paraméter értékeként több száz kódolás és érvényes alternatív név (alias) megadható.[2]

Numerikus karakter referenciák

Akármilyen kódolást használ is egy HTML dokumentum, bármilyen Unicode karakter megjeleníthető a szövegben annak UCS kódjával „&#” és „;” jelek között. Például a magyar kis „ő” betű UCS kódja a decimális 337 (vagy hexadecimális 151), ezért függetlenül a használt kódolástól, a HTML dokumentumban elhelyezett &#337; vagy &#x151; mindig az „ő” betűt fogja megjeleníteni.

Karakter egyedhivatkozások

Bővebben: SGML-entitás

Az SGML számos Unicode karakterhez definiál egyedi megnevezéseket,[3][4] azonban a HTML a lehetséges SGML egyedeknek csak egy részét használja[5] (a használt egyedeket a dokumentum Dokumentumtípus-definíciójában kell megadni, és a HTML 4.01-es verziójáig ez nem tartalmazza a közép-európai karaktereket). Emiatt a magyar ékezetes karakterek közül is csak azokra lehetséges SGML egyedhivatkozást megadni, amelyek a nyugat-európai kódkészletben is megtalálhatók. Vagyis hiába definiálja az SGML például „ő” betűhöz az „odblac” nevet, hivatalosan azt egy böngészőnek nem kell tudnia megjeleníteni egy 4.01-es HTML dokumentum esetén.

Az egyedek neveire az „&” és „;” jelek között hivatkozhatunk, így például az &eacute; a kis „é” betűt jeleníti meg.

XHTML

Az XHTML a HTML megfogalmazása XML-ben (a HTML SGML-ben van definiálva). Gyakorlatilag nincs jelentős eltérés a két nyelv között, csak a formai követelmények lettek szigorúbbak:

HTML5

A HTML5 a következő, jelentősen átdolgozott változata a HTML-nek (Hypertext Markup Language), a web fő jelölőnyelvének. Egyik fő tervezési célja, hogy a webes alkalmazásokhoz ne legyen szükség pluginek (pl. Adobe Flash, Microsoft Silverlight, Sun JavaFX) telepítésére. A specifikáció a HTML4 és az XHTML1 új verzióját jelenti, a hozzájuk tartozó DOM2 HTML API-val együtt. A HTML5 specifikációban leírt formátumba történő migráció HTML4-ről, vagy XHTML1-ről a legtöbb esetben egyszerű, mivel a visszamenőleges kompatibilitás biztosított. A specifikáció a közeljövőben támogatni fogja a Web Forms 2.0 specifikációt is. HTML5-ben lehetőség van audio és videofájlok beillesztésére, erre a célra külön tagek vannak (<audio>, <video>). Továbbá létezik egy úgynevezett <canvas> tag, mely egy vászon. Erre Javascript segítségével lehet rajzolni, vagy képet beilleszteni. Fontos megemlíteni, hogy a HTML5-ből kivették az elrendezés megadó tulajdonságokat. Ezeket CSS-ben kell megadni.

Jegyzetek

  1. Specifying the character encoding in HTML
  2. HTML-ben érvényes karakterkódolások
  3. SGML karakter egyedek. [2008. október 18-i dátummal az eredetiből archiválva]. (Hozzáférés: 2008. október 21.)
  4. SGML-Unicode kódtáblázat. [2015. december 14-i dátummal az eredetiből archiválva]. (Hozzáférés: 2008. október 21.)
  5. A HTML 4-ben használható karakter egyedek

További információk

Kapcsolódó szócikkek