ΕΛ/ΛΑΚ | creativecommons.gr | mycontent.ellak.gr |
freedom

Hunspell: Εισαγωγή

Α. Εισαγωγή

Η Εταιρεία Ελεύθερου Λογισμικού / Λογισμικού Ανοικτού Κώδικα (ΕΕΛ/ΛΑΚ) προσκαλεί κάθε ενδιαφερόμενο να συμβάλει με σχολιασμό για την ιδέα ανάπτυξης και τεχνικής υποστήριξης για διάστημα ενός έτους πληροφοριακού συστήματος (ΠΣ), που θα λειτουργεί online μέσω WEB, διαχείρισης τού εμπλουτισμού τού λεξικού ορθογραφικής διόρθωσης ελληνικών με το Hunspell και του Θησαυρού συνωνύμων τής ελληνικής γλώσσας, το οποίο ΠΣ θα διατίθεται με άδεια EUPL.

Σε λογισμικά με άδεια ανοιχτού κώδικα χρησιμοποιείται ευρέως ο ορθογραφικός διορθωτής Hunspell. Τέτοια λογισμικά είναι το OpenOffice/LibreOffice, FireFox, Thunderbird, Chromium κ.ά.. Η ορθογραφική διόρθωση με το Hunspell βασίζεται σε λεξικά με καταχωρημένους τύπους λέξεων και σε κανόνες συμπεριφοράς τού ορθογραφικού διορθωτή, υπό συγκεκριμένες συνθήκες.

Η πρόσκληση αφορά τη βελτίωση των επιδόσεων τού Hunspell για την ελληνική γλώσσα, κάτι που μεταφράζεται σε εμπλουτισμό τού λεξικού ορθογραφικής διόρθωσης και συνωνύμων με νέες λέξεις αλλά και τη συγγραφή κανόνων. Ως βάση θα χρησιμοποιηθεί το υπάρχον λεξικό ορθογραφικής διόρθωσης ελληνικών τού Hunspell που διαθέτει 575.133 λέξεις.

Προδιαγραφές
Βοηθητικές Επεκτάσεις
Προϋπολογισμός

Α. Εισαγωγή
Η Εταιρεία Ελεύθερου Λογισμικού / Λογισμικού Ανοικτού Κώδικα (ΕΕΛ/ΛΑΚ) προσκαλεί κάθε ενδιαφερόμενο για την ανάπτυξη και τεχνική υποστήριξη για διάστημα ενός έτους πληροφοριακού συστήματος (ΠΣ), που θα λειτουργεί online μέσω WEB, διαχείρισης τού εμπλουτισμού τού λεξικού ορθογραφικής διόρθωσης ελληνικών με το Hunspell και του Θησαυρού συνωνύμων τής ελληνικής γλώσσας, το οποίο ΠΣ θα διατίθεται με άδεια EUPL.
Σε λογισμικά με άδεια ανοιχτού κώδικα χρησιμοποιείται ευρέως ο ορθογραφικός διορθωτής Hunspell. Τέτοια λογισμικά είναι το OpenOffice.org, FireFox, Thunderbird, Chrome, Opera κ.ά.. Η ορθογραφική διόρθωση με το Hunspell βασίζεται σε λεξικά με καταχωρημένους τύπους λέξεων και σε κανόνες συμπεριφοράς τού ορθογραφικού διορθωτή, υπό συγκεκριμένες συνθήκες.
Η πρόσκληση αφορά τη βελτίωση των επιδόσεων τού Hunspell για την ελληνική γλώσσα, κάτι που μεταφράζεται σε εμπλουτισμό τού λεξικού ορθογραφικής διόρθωσης και συνωνύμων με νέες λέξεις αλλά και τη συγγραφή κανόνων. Ως βάση θα χρησιμοποιηθεί το υπάρχον λεξικό ορθογραφικής διόρθωσης ελληνικών τού Hunspell που διαθέτει 575.133 λέξεις.
3 Σχόλια
Oldest
Newest Most Voted
Inline Feedbacks
Δείτε όλα τα σχόλια
Dimitris D

Το hunspell έχει documentation, tutorial, κτλ;
Φυσικά και δεν έχει. Είναι χύμα κώδικας, που συμπληρώνεται από φοιτητές ή καθηγητές(συνήθως μαθηματικών). Είναι βαρετό να γράφουν οδηγίες χρήσης, πως προσθέτεις-γράφεις λεξικά, κτλ.

Menelaos

Ίσως θα μπορούσατε να έρθετε σε επαφή με το Ινστιτούτο Επεξεργασίας του Λόγου (Ι.Ε.Λ.) το οποίο έχει αναπτύξει έναν εξελιγμένο διορθωτή κειμένου ΣΥΜΦΩΝΙΑ http://www.ilsp.gr/correct.html, το οποίο και διαθέτει ως προϊόν.

Προσωπικά δεν τον έχω χρησιμοποιήσει, φαίνεται όμως από την περιγραφή να έχει πολύ εξελιγμένα χαρακτηριστικά.

Επειδή όμως, από ότι φαίνεται από το site τους έχει μείνει είδη πολύ πίσω τεχνολογικά αφού στις πληροφορίες αναφέρεται το Microsoft Word 97, ίσως θα τους ενδιέφερε να δώσουν το προϊόν ως ανοιχτό λογισμικό και να προσαρμοστεί για χρήση από το Libre Office.

Steve Stavropoulos

Να δώσω ένα μικρό update σχετικά με το τι γίνετε στο υπάρχον ελληνικό ορθογραφικό λεξικό.

Στις επόμενες μέρες θα βγει νέα έκδοση του λεξικού η οποία θα έχει 240 χιλιάδες καινούργιες λέξεις, οπότε το σύνολο των λέξεων θα ανέρχετε στις 828.806 λέξεις. Επίσης υπάρχουν άλλες 4.196 λέξεις προς έλεγχο.

Το development του λεξικού μπορεί να το παρακολουθήσει όποιος θέλει μέσω του https://github.com/stevestavropoulos/elspell Μάλιστα όποιος το κατεβάσει ( git clone git://github.com/stevestavropoulos/elspell.git ) και τρέξει make, θα πάρει αυτόματα και ένα zip με την τρέχουσα development έκδοση.

Η αίσθηση μου είναι ότι μετά από αυτό το update, το λεξικό θα είναι σε τέτοια φάση που δε θα χρειάζετε ιδιαίτερη βοήθεια από την ΕΕΛ/ΛΑΚ. Ίσως θα είχε μεγαλύτερα και ποιο ουσιαστικά αποτελέσματα η επένδυση σε άλλους τομείς, όπως η δημιουργία συνωνύμων και ο χαρακτηρισμός των λέξεων (μέσω προγράμματος αυτόματης κλίσης τους).