Skocz do zawartości

Automatyczne poprawianie polskich znakow


propaganja

Rekomendowane odpowiedzi

Wiec tak. Czy jest to mozliwe w jakims programie? Mam niedorobionego windowsna nijak nie da sie ustawic zeby pisac po polsku. A pisze sobie w wolnych chwilach powiesc (jesli ktos pamieta gmclanowe bitwy literackie - to rozwijam moje opowiadanie z drugiej tury), i ogolnie w porzadku tylko jak sobie wyobrazam recznie dodawac polskie znaki w ponad 10 rozdzialach to mnie ch.. strzela. Nie bawilem sie dawno wordem czy officem i nie pamietam czy program daje taka mozliwosc (zeby w calym teksie z automatu wszystko poprawil), wie ktos?

Odnośnik do komentarza
Udostępnij na innych stronach

propaganja, w jakim kodowaniu masz tekst? Biorąc pod uwagę, że baza jest spora (16 MB), to trzeba mieć porządną maszynkę do tego
Nie?

Nie musisz przecież przelatywać całej bazy co każde słowo, robisz tylko hashtable dla wszystkich słówek które mają w sobie chociaż jedną polską literkę, gdzie kluczem jest słowo bez polskich znaków a wartością oryginalne słowo i masz ładną wydajność, gdzie ładna to u mnie 30kb tekstu przełożone w 276ms (trochę dłużej trwa przygotowanie bazy, ale te 5 sekund można na odpalenie programu poczekać).

 

Programik w sumie mam i w sumie działa, problemik jest tylko taki, że często jest więcej niż jedna możliwość dodania polskich znaków do słowa, i przez to powstają takie abstrakcje jak "ją" zamiast "ja", czy lepiej "ód" zamiast "od" (cokolwiek znaczy "ód").

Zrobię żeby w takich przypadkach (jak więcej kilka polskich słów ma takie same bezpolskoznakowe odpowiedniki) nie zamieniał słowa w ogóle, dorobię obsługę wielkich liter i mogę wysłać.

 

Jaki ja uczynny dzisiaj.

 

Ed: Mhm, z kodowaniem też się będę musiał pobawić bo zamiast ł robi kwadraciki.

Odnośnik do komentarza
Udostępnij na innych stronach

Nie musisz przecież przelatywać całej bazy co każde słowo, robisz tylko hashtable dla wszystkich słówek które mają w sobie chociaż jedną polską literkę, gdzie kluczem jest słowo bez polskich znaków a wartością oryginalne słowo i masz ładną wydajność, gdzie ładna to u mnie 30kb tekstu przełożone w 276ms (trochę dłużej trwa przygotowanie bazy, ale te 5 sekund można na odpalenie programu poczekać).
aha, dzięki kapitanie oczywisty

 

Ed: Mhm, z kodowaniem też się będę musiał pobawić bo zamiast ł robi kwadraciki.

<facepalm>

Odnośnik do komentarza
Udostępnij na innych stronach

to trzeba mieć porządną maszynkę do tego

_wyjaśnienie bo ewidentnie nie miałeś racji_
aha, dzięki kapitanie oczywisty
Mhm?

Pieprznąłeś głupotą że zalatywało z kilometra to wyjaśniłem jak to zrobić żeby nie muliło. Skoro to takie oczywiste to trzeba było nie gadać wcześniej głupot. Chyba że to taki żarcik był, to ok.

Odnośnik do komentarza
Udostępnij na innych stronach

Odrażająca, jak się zdanie zaczyna z małej litery, nie kończąc nawet kropką.

błędy ortograficzne są straszniejsze niż celowe olewanie wielkiej litery i kropek, misiu

i dzięki za cytat, zauważyłem niepotrzebne "a"

 

już pomijam to, że nie załapałeś

Odnośnik do komentarza
Udostępnij na innych stronach

http://dawidds.net/lol/polskieznaki.7z

 

Tak na oko to dodaje polskie znaki do gdzieś 70% słów, nie _powinien_ niczego zjebać bo jak nie jest pewny słowa (ma wiele możliwości) to go po prostu nie zmienia. Pierwsze okienko to wczytywanie (plik źródłowy), drugie to zapis, ale tego się chyba domyślisz. Źródłowy może być kodowany w byle czym i _powinien_ wczytać i tak, docelowy będzie kodowany w utf8, ale to z kolei Cię pewnie gówno obchodzi więc się już nie rozpisuje D:

 

Jeśli się nie odpala to ściągnij .net framework 4, mogłem skompilować pod jakiś starszy ale wpadłem na to teraz a wrzucać drugi raz mi się nie chce, jakoś se poradzisz.

Odnośnik do komentarza
Udostępnij na innych stronach

  • Administratorzy

ściągnij EMACS, mój wykładowca napisał do niego wtyczkę (jest chyba wbudowana), że jakoś tam z pomocą slasha polskie znaki robią się same

 

Edit: dokładnie to jako /a /c /l itp.

 

W/lodek Bzyl and Ryszard Kubiak wrote "ogonek.el", a package for changing the encoding of Polish characters.

Odnośnik do komentarza
Udostępnij na innych stronach

Nie wiem czy to coś da na twoim kompie ale czy próbowałeś wpisywać polskie znaki za pomocą tyldy? Na niektórych kompach tak się da, nie wiem od czego to zależny bo np. na siostry lapie już się nie da.

 

Np:

shift + ~ , l -> ł

shift + ~ , o -> ó

shift + ~ , x -> ź

 

shift + ~ , shift + l -> Ł

shift + ~ , shift + o -> Ó

shift + ~ , shift + ź -> Ź

Odnośnik do komentarza
Udostępnij na innych stronach

błędy ortograficzne są straszniejsze niż celowe olewanie wielkiej litery i kropek, misiu

i dzięki za cytat, zauważyłem niepotrzebne "a"

 

już pomijam to, że nie załapałeś

 

Literówka jest bardzo częsta i raczej nie jest tak straszna. To nie Twój celowy błąd, tylko przypadkowy, więc nie wiem po co miałem ją wymieniać?

Odnośnik do komentarza
Udostępnij na innych stronach

Literówka jest bardzo częsta i raczej nie jest tak straszna. To nie Twój celowy błąd, tylko przypadkowy, więc nie wiem po co miałem ją wymieniać?

oj, ty zabawopsuju

"od razu" -> Dawiddsowe "odrazu" -> "odrażające"

jeszcze jakieś wyjaśnienia? ;p

Odnośnik do komentarza
Udostępnij na innych stronach

Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto

Jedynie zarejestrowani użytkownicy mogą komentować zawartość tej strony.

Zarejestruj nowe konto

Załóż nowe konto. To bardzo proste!

Zarejestruj się

Zaloguj się

Posiadasz już konto? Zaloguj się poniżej.

Zaloguj się
  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...