arxmliv-embeddings-082017.md

layout: page
title: arXMLiv 08.2017 - Word Embeddings; Token Model
  cat token_model_no_problem.txt \
      token_model_warning.txt \
      token_model_error.txt > token_model_complete.txt
python eval/python/word_analogy.py --vocab_file vocab.arxmliv.txt --vectors_file glove.arxmliv.5B.300d.txt
python eval/python/distance.py --vocab_file vocab.arxmliv.txt --vectors_file glove.arxmliv.5B.300d.txt
Word: lattice  Position in vocabulary: 311

                               Word   Cosine distance

-----------------------------------------------------

                           lattices		0.811057

                          honeycomb		0.657262

                             finite		0.625146

                         triangular		0.608218

                            spacing		0.605435
Word: entanglement  Position in vocabulary: 1293

                               Word   Cosine distance

-----------------------------------------------------

                          entangled		0.763964

                       multipartite		0.730231

                           fidelity		0.653443

                        concurrence		0.652454

                      environemtnal		0.646705

                         negativity		0.646165

                            quantum		0.639032

                            discord		0.624222

                        nonlocality		0.610661

                         tripartite		0.609896
Word: forgetful  Position in vocabulary: 10697

                               Word   Cosine distance

-----------------------------------------------------

                            functor		0.723019

                           functors		0.653969

                           morphism		0.626222
Word: eigenvalue  Position in vocabulary: 1212

                               Word   Cosine distance

-----------------------------------------------------

                        eigenvalues		0.878527

                        eigenvector		0.766371

                      eigenfunction		0.761923

                       eigenvectors		0.747451

                     eigenfunctions		0.707346

                         eigenspace		0.661539

                      corresponding		0.629746

                          laplacian		0.627187

                           operator		0.627130

                              eigen		0.620933
Word: riemannian  Position in vocabulary: 2026

                               Word   Cosine distance

-----------------------------------------------------

                           manifold		0.766196

                          manifolds		0.745785

                             metric		0.714120

                          curvature		0.672975

                            metrics		0.670006

                            finsler		0.665079

                              ricci		0.657058

                          euclidean		0.650198

                            endowed		0.626307

                         riemmanian		0.621626

                          riemanian		0.618022