Ibland förklaras språk som ett grammatiskt system med lexikon (ordförråd) och regler för hur orden kombineras till satser men om vi tänker på hur vi använder språket och hur vi ofta missförstår varandra så förstår vi att språket är mycket komplext. När vi gör tolkningar och drar slutsatser så gör vi det inte bara utifrån orden som sägs utan också från gemensam kunskap, gester, tonfall och sammanhang. Datorer är programmerade av människan för att utföra order snabbt och effekivt. De är kraftfulla och de har stor lagringskapacitet. Men kan de förstå språk? Det regelsystem som vi har och som verkar enkelt är nästan omöjligt för datorn att processa. Vad är det i språket som gör att vi förstår varandra? Ska datorerna kunna lära sig detta också? Är det möjligt att bygga in all vår kunskap i datorn? Inom ämnet datalingvistik studerar man hur språket är uppbyggt och fungerar och hur datorerna skall programmeras för att kunna processa språk snabbt och effektivt. Översättning är ett viktigt område för språkteknologin, världens språk har nämligen inte ett 1-1 förhållande, vilket innebär att ett ord inte alltid motsvaras av precis ett annat ord på det fråmmande språket. Alla världens språk har inte exakt samma ordförråd och dessutom sätts orden ihop till fraser på olika sätt. En lösning vore att alla talar samma språk men det är en orimlighet. Europeiska Unionen har till exempel bestämt att alla deras dokument skall översättas till unionens alla språk. Anpassning och översättning av program och manualer är ett annat område, och det börjar bli allt vanligare med översättning av elektronisk post, just för att förenkla kommunikationen mellan människor. Ibland vill man kunna få information från en databas som är lagrad på ett visst språk fast man själv talar ett annat.
Skrivstöd är ett också ett område för språkteknologin. När man ordbehandlar vill man kunna slå upp ord i lexikon för att se vad de betyder, hitta synonymer och kanske ta reda på vad ord heter på ett främmande språk. Sen vill man ha fungerande stavningskontroll - ord som låter lika kan stavas på flera sätt, till exempel "stjäl", "själ" och "skäl". Då vill man att datorn inte bara kontrollerar att ordet är rättstavat utan också att det är rätt ord i just det sammanhanget. Grammatik- och stilkontroll är andra verktyg.
Ännu ett område är talteknologi. Ibland kan man behöva styra datorn med hjälp av rösten. Men det kräver att datorn förstår vad användaren säger. När datorn själv skall tala måste man också ta hänsyn till betoning, tonhöjd och tryckstyrka.
Andra talteknologiska områden är kontoupplysning hos banker och tidtabell upplysning hos reseföretag. Även inom dessa områden sysslar man med översättning - tänk Dig att tala svenska i Din telefon fast det som hörs i andra änden är japanska!
Inom handikappområdet är språkteknologin viktig. Det vore bra att med rösten få datorn att utföra kommandon och att kunna läsa in texter. För blinda och språkhandikappade finns möjligheten att kunna få texter upplästa.
Dokumenthantering: vi behandlar allt större mängder dokument. Det rör sig om allt från från epost till manualer och teknisk dokumentering. För att snabbt kunna bilda sig uppfattning om vad ett dokument handlar om kan man få en sammanfattning av en text. Ibland vill man hitta dokument som handlar om ett visst ämne och ibland vill man få ut vissa speciella fakta ur en text. Här spelar språkteknologin en stor roll. Det är ju inte alltid som själva orden leder till rätt resultat, ibland krävs även en viss förståelse av vad texterna handlar om. Vi människor har ju en del världskunskap och situationsberoende tolkningar att ta till.
Datorstödd undervisning är också ett område för språkteknologin. Ett bra sätt att lära sig språk är att göra övningsuppgifter där datorn samarbetar med användaren och reagerar på konstigheter. Detta kallas Computer Assisted Language Learning.
Människa-datorinteraktion: För att det skall vara lätt att använda datorn, lätt att hitta information och förstå hur man navigerar sig fram inom programmen så måste datorprogrammen vara anpassade och utformade efter människan. Det gäller både hur programmet ser ut på datorskärmen och hur de olika dokumenten är strukturerade inbördes. För att kunna göra alla dessa saker måste man dels ha grundlig kunskap om hur språket är uppbyggt och hur det fungerar, och dessutom måste man förstå datorer. Därför måste man formalisera språket, göra det matematiskt precist, till exempel med hjälp av logik.