To access the full text documents, please follow this link: http://hdl.handle.net/2117/100157

Fast calculation of entropy with Zhang's estimator
Lozano Bojados, Antoni; Casas Fernández, Bernardino; Bentz, Chris; Ferrer Cancho, Ramon
Universitat Politècnica de Catalunya. Departament de Ciències de la Computació; Universitat Politècnica de Catalunya. COMBGRAPH - Combinatòria, Teoria de Grafs i Aplicacions; Universitat Politècnica de Catalunya. LARCA - Laboratori d'Algorísmia Relacional, Complexitat i Aprenentatge
Entropy is a fundamental property of a repertoire. Here, we present an efficient algorithm to estimate the entropy of types with the help of Zhang’s estimator. The algorithm takes advantage of the fact that the number of different frequencies in a text is in general much smaller than the number of types. We justify the convenience of the algorithm by means of an analysis of the statistical properties of texts from more than 1000 languages. Our work opens up various possibilities for future research.
Peer Reviewed
-Àrees temàtiques de la UPC::Informàtica::Informàtica teòrica
-Entropy (Information theory)
-Entropy estimation
-Lexical diversity
-Parallel corpora
-Entropia (Teoria de la informació)
Article - Submitted version
Book Part
RAM - Verlag
         

Show full item record

Related documents

Other documents of the same author

Bentz, Chris; Alikaniotis, Dimitrios; Cysouw, Michael; Ferrer Cancho, Ramon
Casas Fernández, Bernardino; Catala Roig, Neus; Ferrer Cancho, Ramon; Hernández Fernández, Antonio; Baixeries i Juvillà, Jaume
Casas Fernández, Bernardino; Hernández Fernández, Antonio; Catala Roig, Neus; Ferrer Cancho, Ramon; Baixeries i Juvillà, Jaume
Casas Fernández, Bernardino; Catala Roig, Neus; Ferrer Cancho, Ramon; Baixeries i Juvillà, Jaume
Hernández Fernández, Antonio; Casas Fernández, Bernardino; Ferrer Cancho, Ramon; Baixeries i Juvillà, Jaume
 

Coordination

 

Supporters