Jump to content
loki

dictionar

Recommended Posts

Posted (edited)

Muncesc la o faza, un dictionar pentru brute cu cuvinte romanesti.

Momentan la litera A am cam 4500 cuvinte. Muncesc de la pranz si am ajuns la B. Cu â din a, din i etc.

Intrebarile sunt urmatoarele:

- la arhive si chestii offline pare util. Dar un dictionar atat de mare (si de necontrolat) e util la hackerit ceva?

- ii trebuie cuiva?

- se vinde? :D

Edited by loki
Posted

Te ajut, daca vrei. Ma ai in lista, da, ajuta foarte mult mai ales cu lista mea de "mutatii" ce pot fi aplicate pe cuvinte pentru a rezulta cele mai frecvente tipuri de parole. Am studiat destul ca sa pot sa-ti dau informatii utile despre cele mai dese tipuri de parole intalnite - statistici pe zeci de mii de parole - organizate pe diferite ramuri de utilizatori etc.

LE : Eu am cativa gb buni de dictionare adunate de peste tot, majoritatea limbi internationale - en,fr,ger. Numa intreaba-i pe hertz, unu, si restul de pe rst cat i-am ajutat cu ele. (evident sortate, curatate )

Posted (edited)

cele mai utilizate - da, e o metoda buna. Ce am eu e un dictionar brut cu cuvinte de toate felurile.

exemplu


baton
batos
batoza
batozar
batracian
batrâior
batrân
batrânel
batrânesc
batrâneste
batrânet
batrânete
batrânica
batrânicios
batrânime
batrânior
batrânis
batuci
bau
baubau
baubil
baud
bauni
baut

mie-mi place sa colectionez. (aaa, "â" il las pentru replace la urma - va trebui sa duplic cuvintele in i si a. De asemenea imi propun o ordonare dupa numarul de litere.)

Edited by loki
Posted

mi-am adus aminte de el si l-am dat gata.

Ma cam mira ca situl se lauda cu peste 300.000 cuvinte, am gasit doar vreo 100.000

FileShare Download dictionar.zip

filtrat, sortat, aranjat in fisiere separate dupa numarul de litere. Cu â din a si din i cu linii, spatii si fara. Cele de la 20 de litere in sus is cam degeaba dar erau si ele acolo.

Poate va e de folos!

Guest Nemessis
Posted

Foloseste mIRC pentru a crea o lista imensa de cuvinte romanesti. Poti scripta clientul sa salveze orice cuvant sau nickname. Intri pe canale gen #apropo (irc.apropo.ro) si il lasi sa stranga singur de nebun sute de mii de cuvinte romanesti si nu numai. Am vrut sa fac asta dar mereu mi-a fost prea lene :)

Posted (edited)
pentru a crea o lista imensa de cuvinte romanesti

La ce bun?

Daca cuvintele nu sunt sortate, nu au o anumita ordine sau se repeta, este inutil.

edit:

lokipaki, am dat reply la postul lui nemessis...

Edited by nosferatu
Posted (edited)
La ce bun?

Daca cuvintele nu sunt sortate, nu au o anumita ordine sau se repeta, este inutil.

esti degeaba. Dictionarul pus de mine este si sortat, are si o anumita ordine si nu se repeta. Plus inlocuirea diacriticelor si a accentelor sedilelor si pana mea ce mai era acolo. Si asta prin batch-uri aplicate abia dupa ce a fost strans un sir de cuvinte amestecate. Crezi ca am downloadat eu alfabetic?

@nemesis nu le am deloc cu mircu... tentanta idee, momentan n-am vrut sa decat sa spicuiesc dexonlinul dupa <title>cuvant</title> sa vad ce iese. Ma tenta insa si as putea cumva usor sa dau jos pagini intregi scrise in romana si sa le sortez pe cuvinte. Un combine files in windows commander si putina scriptareala de sortare (acu am functiile puse deoparte) Ce mi-ar lipsi din dictionarul actual ar fi accentuarea cuvintelor (am molie n-am molia).

Edited by loki
Guest Nemessis
Posted
La ce bun?

Daca cuvintele nu sunt sortate, nu au o anumita ordine sau se repeta, este inutil.

edit:

lokipaki, am dat reply la postul lui nemessis...

Se pot sorta/ordona si se pot scoate duplicatele foarte usor.

Posted (edited)

@nos stiam ca e reply la neme dar mi se parea ca te bagi aiurea. Nici eu nu am inceput cu o lista sortata. Nu am vrut sa fiu asa rautacios dar mi-a scapat.

Apropo de asta uite cum am facut filtrarea. Si da, merge si pe mirc si peste tot.

Avem un fisier nesortate.txt ce contine lista de cuvinte. Folosind lista de mai jos am facut replace manual:

ã¥=a
ã¤=a
ã¶=o
ã¼=u
ã©=e
ã§=c (din francais)
ã¹=u
ấ=â
ä‚=a
ã¨=e
ắ=a
ãš=u
å£=t
åÿ=s

Am eliminat toate diacriticele (in afara de â). Pot fi tot felul de "purificari" dupa gust, ideea e ca in final sa ramana doar [a-z] si â

01extrageadina.bat extrage cuvintele care contin â pentru a le duplica (in a si i). De fapt creeaza un fisier nou continand toate cuvintele formate din macar un caracter diferit de [a-z] (printre care si spatii si cratime) de aia era necesara o curatare initiala.

echo off
REM copie intr-un nou fisier cuvintele cu â
del selected.txt
FOR /F "tokens=* delims=" %%A IN ('findstr /R "[^a-z]" nesortate.txt') DO echo %%A>>selected.txt
pause

Am dat replace manual in nesortate.txt â devine i iar in selected.txt â devine a. Le-am unit.

Similar am facut cu spatiile si liniile (gandind ca unii ar scrie si gramatical.)

02separa.bat creeaza fisierele denumite 01.txt 02.txt... in functie de numarul de litere. Le pune in folderul 02separate.

@echo off
setlocal
cls
md 02separate
del .\02separate\*.txt
set exit=false
set number=1
set mask=.
:LoopStart
echo %number%%mask%
set /a filename=%number%
if %filename% LEQ 9 set filename=0%filename%
FOR /F "tokens=* delims=" %%A IN ('findstr /R /X "\<%mask%\>" nesortate.txt') DO @echo %%A>>.\02separate\%filename%.txt
@echo off
IF NOT EXIST .\02separate\%filename%.txt set exit=true
set /a number+=1
set mask=%mask%.
IF %exit%==false GOTO LoopStart
echo Gata!
pause
endlocal

03sorteaza.bat sorteaza fisierele txt si le pune in folderul 03sortate. Foloseste o comanda batch "sort" asa ca aici treaba-i simpla


@echo off
setlocal
cls
md 03sortate
del .\03sortate\*.txt
set exit=false
set number=1
:LoopStart
set /a filename=%number%
if %filename% LEQ 9 set filename=0%filename%
IF NOT EXIST .\02separate\%filename%.txt GOTO LoopEnd
echo %number%%mask%
SORT ./02separate/%filename%.txt /O ./03sortate/%filename%.txt
@echo off
set /a number+=1
GOTO LoopStart
:LoopEnd
echo Gata!
pause
endlocal

04filtreaza.bat reparcurge dictionarul pentru a extrage doar inregistrarile unice. Creeaza 04filtrate care e folderul final (redenumit in dictionar in arhiva)

@echo off
setlocal ENABLEDELAYEDEXPANSION
cls
md 04filtrate
del .\04filtrate\*.txt
set exit=false
set number=1
set mask=.

:LoopStart
set /a filename=%number%
if %filename% LEQ 9 set filename=0%filename%
IF NOT EXIST .\03sortate\%filename%.txt GOTO LoopEnd
echo %number%%mask%

FOR /F "tokens=* delims=" %%A IN ('findstr /R /X "\<%mask%\>" .\03sortate\%filename%.txt') DO (
IF !tmpvar! NEQ %%A echo %%A>>.\04filtrate\%filename%.txt
set tmpvar=%%A)

@echo off
set mask=%mask%.
set /a number+=1
GOTO LoopStart
:LoopEnd
echo Gata!
pause
endlocal

Edited by loki
Posted (edited)

SAlutare LOKI ! Am si eu o intrebare referitor la dictionarul tau! Am vazut ca este super sortat !!! Multam ptr share in primul rand, dar de ce nu pot trecece toate cuvintele intrun singur fisier .txt.Poate suna stupid .....dar cred ca ti-ai dat seama ca sunt cam ...cam de tot INcePAtor !!

UItati-va si aici : hxxp://packetstormsecurity.org/Crackers/wordlists/

Multam anticipat!

Edited by ronin33dan

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.



×
×
  • Create New...