Sindup:Doc Classifier

De Hegyd Doc.

Process Classifier subject

  • Validation du record
    • La news ne doit pas être de type réseaux sociaux
    • La news ne doit pas appartenir à un user
  • Parcours des feuilles
    • Recherche des subjects parents
      • Parcours des parents
        • Test du subject
          • Chargement du model du subject en français
          • SvmPredict
          • Modification du résultat en fonction des options
          • Si resFinal > 0,6
            • Ajout dans la liste d'insertion
          • Sinon
            • Blacklist du reste des parents
  • Insertion en base
    • S'il y a des subjects dans la liste d'insertion
      • Retire les parents de la liste si un enfant est également présent
    • Limitation aux 5 subjects avec les rates les plus élevés
Liste des options
Options Res de svmPredict 0 < resFinal < 1
Toujours 1
Souvent Res >= 0.5 Res * 1.4
Souvent Res < 0.5 Res * 1.3
Parfois Res >= 0.5 Res * 1.2
Parfois Res < 0.5 Res * 1.1
Jamais 0



Process Classifier folder

  • Validation du record
    • La news ne pas être de type réseaux sociaux
  • Rechercher tout les folders
  • Parcours des folders
    • Le folder doit être flaggé en classement AUTO
    • Check du record par rapport au folder
      • La news ne doit pas appartenir à un autre user ou à un autre client
      • La news ne doit pas être payante pour les users gratuits
      • La news ne doit pas appartenir à une source ignorées par le user
      • La news doit appartenir à certaine source si c'est l'option choisi par le user
    • Chargement du model correspondant au folder et la langue de la news
      • Il doit y avoir un model correspondant
      • Le type de la news doit correspondre au type choisi par l'utilisateur
    • SvnPredict
      • Si le res >= rate déterminer par le user entre 0,4 et 0,9
  • Insertion en base de données dans folderNews et dans newsPermanent