arxmliv-embeddings-082018.md

layout: page
title: arXMLiv 08.2018 - Word Embeddings; Token Model
  cat token_model_no_problem.txt \
      token_model_warning.txt \
      token_model_error.txt > token_model_complete.txt
python2 eval/python/word_analogy.py --vocab_file vocab.arxmliv.txt --vectors_file glove.arxmliv.11B.300d.txt
python2 eval/python/distance.py --vocab_file vocab.arxmliv.txt --vectors_file glove.arxmliv.11B.300d.txt
Word: lattice  Position in vocabulary: 488

                              Word       Cosine distance

---------------------------------------------------------

                          lattices		0.853103

                        triangular		0.637767

                          honeycomb		0.626426

                            crystal		0.624397

                            finite		0.614720

                            spacing		0.603067
Word: entanglement  Position in vocabulary: 1568

                              Word       Cosine distance

---------------------------------------------------------

                          entangled		0.780425

                      multipartite		0.730968

                        concurrence		0.691708

                        negativity		0.649595

                        tripartite		0.647623

                            quantum		0.640395

                          fidelity		0.640285

                      teleportation		0.616797

                            discord		0.613752

                            entropy		0.612341

                          bipartite		0.608034

                          coherence		0.606859

                        nonlocality		0.601337
Word: forgetful  Position in vocabulary: 11740

                              Word       Cosine distance

---------------------------------------------------------

                            functor		0.723472

                          functors		0.656184

                          morphism		0.598965
Word: eigenvalue  Position in vocabulary: 1448

                              Word       Cosine distance

---------------------------------------------------------

                        eigenvalues		0.893073

                        eigenvector		0.768380

                      eigenvectors		0.765241

                      eigenfunction		0.754222

                    eigenfunctions		0.686141

                        eigenspace		0.666098

                              eigen		0.641422

                            matrix		0.616723

                          eigenmode		0.613117

                        eigenstate		0.612188

                          laplacian		0.611396

                            largest		0.606122

                          smallest		0.605342

                        eigenmodes		0.604839

Word: riemannian  Position in vocabulary: 2285

                              Word       Cosine distance

---------------------------------------------------------

                          manifolds		0.765827

                          manifold		0.760806

                            metric		0.719817

                            finsler		0.687826

                          curvature		0.676100

                              ricci		0.664770

                            metrics		0.660804

                        riemmanian		0.651666

                          euclidean		0.644686

                        noncompact		0.643878

                        conformally		0.638984

                          riemanian		0.633814

                            kahler		0.632680

                            endowed		0.622035

                        submanifold		0.613868

                      submanifolds		0.612716

                          geodesic		0.604488