Die Hauptidee vom P.E.S ist sehr einfach. Wenn du mir die URL Adresse als Startpunkt einer Menge der Web-Sites gibst, ich parse diese Web-Sites durch, analysiere ihren Textinhalt automatisch und ich gebe dir die Möglichkeiten diese unübersichtliche Menge von Dokumenten durchsichtlich anzuschauen. Was heißt das durchsichtlich? Erstens, es wird automatisch Inhalt erzeugt, also die Dokumenten die übereinander verknüpft sind werden auf logische Weise nacheinander seriel organisiert. Zweitens, es wird von allen HTML-Referenzen einen Index produziert, daß dem Benutzer ein Register von Stichwörter anbietet und drittens das System gibt dem Benutzer die Möglichkeit eine Informationsuche im freien Deutsch zu führen.
Es gibt meherere Suchmaschinen im Internet mit unterschiedlichen Methoden für Datenvorbereitung und mit unterschiedlichen Suchergebnissen. Unsere Methode basiert auf linguistischer Bearbeitung und besteht aus zwei Stufen, zwei unterschiedlichen Zugänge zur Problematik der Spracherkennung. Erste Stufe macht statistische Untersuchung von Stichwörter, Stufe zwei führt rein analytisch eine linguistische Bearbeitung der Dokumenten durch. Wir kombinieren beide Stufen mit Ziel dem Benutzer möglichst genaue Antworten anzubieten.