Recherche de termes et de phrases (recherche booléenne en texte intégral)

Recherche de termes et de phrases (recherche booléenne en texte intégral)




*faites défiler jusqu'à nos tableaux de connecteurs de recherche de base, intermédiaire et avancée (ou téléchargez-les au format PDF au bas de cette page) pour des explications plus détaillées sur ce qui précède

La recherche avec des connecteurs tels que and, or, ou w/5 entre vos termes de recherche est appelée recherche de termes et de connecteurs . C'est une bonne stratégie à utiliser lorsque vous avez besoin d'être plus précis dans la langue que vous recherchez. Vous trouverez ci-dessous des instructions étape par étape ainsi que quelques vidéos pour vous aider à démarrer la recherche en texte intégral.


Dans quelle mesure les recherches en texte intégral sont-elles vraiment utiles ? - Vidéo



Dans la vidéo ci-dessus et l'explication ci-dessous (« Dans quelle mesure les recherches en texte intégral sont-elles vraiment utiles ? ») , vous verrez la différence dans les résultats d'une recherche générale (sans recherche en texte intégral) par rapport à quatre niveaux de recherche en texte intégral, et nous verrons à quel point le recherche texte intégral est précieux  

RÉSUMÉ:

  1. Toute recherche en texte intégral éliminera 90% du temps perdu par des méthodes telles que l'utilisation de Ctrl+F
  1. Les connecteurs de proximité, les caractères de remplacementet les synonymes peuvent vous fournir plus de 10 fois plus de résultats pertinents instantanément.
  1. Cela vaut la peine d'en apprendre au moins un peu sur la recherche en texte intégral

Dans quelle mesure les recherches en texte intégral sont-elles vraiment utiles ? - Étude de cas

Dans l'étude de cas suivante, nous effectuons une recherche de base à travers 5 étapes différentes sur l'échelle simplicité-complexité et voyons l'effet qu'elle a sur nos résultats réels. Cette étude de cas suit exactement le même exemple couvert dans la vidéo ci-dessus «Dans quelle mesure les recherches en texte intégral sont-elles vraiment utiles ? » Nous vous conseillons également de faire défiler vers le bas pour afficher les tableaux des connecteurs de recherche pour débutants, intermédiaires et avancés (ou de les télécharger au format PDF à l'adresse au bas de cet article) pour des explications complètes sur le fonctionnement des connecteurs dans les recherches.


RECHERCHE D'ÉTUDE DE CAS, étape 1 : catégories mais pas de termes de recherche


  1. Nous commençons par une simple recherche de tous les états financiers des sociétés de produits de consommation et de produits industriels.
  2. Dans l'ensemble de données Dépôts SEDAR , ajoutez les critères Industrie et Catégorie de dépôt s'ils ne sont pas déjà ajoutés en cliquant sur le lien + Ajouter des critères en haut à gauche de votre écran.
    1. Dans Industrie , ajoutez les produits de consommation et les produits industriels.
    2. Dans la catégorie de dépôt , ajoutez les états financiers
    3. Dans Date de dépôt , ajoutez les 2 dernières années
    4. Cliquez sur Rechercher
  3. Vous obtiendrez 1000 résultats
    1. Il s'agit de nombreux états financiers mais nous ne savons pas s'ils parlent de ce qui nous intéresse : le bénéfice net et la croissance des ventes.
    2. Nous pouvons cliquer sur chaque résultat et rechercher ces termes document par document, comme en utilisant Ctrl+F sur un dépôt SEDAR depuis sedar.com.
    3. Cette récupération n'a pas de composant de recherche en texte intégral

 

RECHERCHE D'ÉTUDE DE CAS, étape 2 : ajouter des termes de recherche et utiliser and

  1. Question :  « Dois-je trouver des mots ou des phrases spécifiques dans ces documents? »
  1. Revenez à votre écran de recherche et ajoutez les mots-clés bénéfice net and croissance des ventes à votre recherche et cliquez à nouveau sur Rechercher (vous pouvez copier et coller la recherche à partir d'ici)
    1. Vous disposez maintenant de deux expressions exactes (les mots séparés par des espaces sont des expressions exactes) qui doivent apparaître dans le document (« and » indique que les deux expressions doivent être présentes dans le document mais ne précise aucune relation entre elles).
  2. Notez le nombre de résultats que vous récupérez (au moment du tournage de cette vidéo c'était 74 résultats)
    1. Vous pourrez cliquer sur chaque résultat et voir automatiquement à tout moment que soit bénéfice net, soit croissance des ventes apparaissent dans chaque dépôt.
    2. Le résultat de 74 signifie que 926 (92,6 %) des résultats de votre première recherche n'étaient pas pertinents et étaient essentiellement du bruit.
      1. Cette simple recherche vous a déjà fait gagner 90 % du temps que vous passeriez si vous n'utilisiez aucune recherche en texte intégral, mais il lui manque toujours la majorité des résultats valides.
    3. Cette recherche utilise le connecteur et – and – pour spécifier plus d’un mot ou une expression à trouver 

 

RECHERCHE D'ÉTUDE DE CAS, étape 3 : ajout d'un connecteur de proximité

  1. Question :  « Certaines de mes expressions sont-elles trop spécifiques ? »
  2. Question :  « Est-ce que je recherche des termes de recherche à inclure dans la même discussion mais pas nécessairement pour constituer une expression exacte? »
  1. Revenez à votre recherche et modifiez la recherche en bénéfice net and (croissance w/5 vente) et cliquez à nouveau sur Rechercher
    1. Cela permet de remplacer l'expression croissance des ventes par n'importe quelle expression incluant ventes et croissance à moins de 5 mots l'une de l'autre.
    2. Ceci n'est pas directionnel, vous obtiendrez donc croissance des ventes internationales, ainsi qu'une croissance des ventes intérieures, croissance des ventes au quatrième trimestre, entre autres variations.
  2. Notez le nombre de résultats que vous récupérez (au moment du tournage, il y en avait 182) – c'est plus du double du nombre de résultats récupérés à l'étape 2.
    1. Cette recherche utilise le connecteur de proximité – w/n – (où n serait remplacé par n'importe quel nombre compris entre 1 et 5000, afin de limiter la distance maximale que vous accepterez entre le mot ou la phrase qui le précède et le mot ou la phrase qui le suit) pour s'assurer que les termes sont liés ou proches les uns des autres

 

RECHERCHE D'ÉTUDE DE CAS, étape 4 : ajout d'un caractère de remplacement

  1. Question :  « Ai-je besoin de variations sur les formes exactes de mes termes de recherche, telles que les pluriels ou les temps ? »
  1. Revenez à votre recherche et modifiez la recherche sur bénéfice* net* and (croi* w/5 vente*), puis cliquez à nouveau sur Rechercher .
    1. Cela vous permettra d'obtenir un bénéfice net ainsi que des bénéfices nets et également de croître ainsi que croîs, croît, croissons, croissez, et croissent, mais il n'obtiendra PAS grandir  (pour grandir , vous devez l'ajouter comme synonyme à l'étape 5 ci-dessous, puisqu'il ne commence pas par les mêmes quatre lettres que croi*)
    2. Quand vous ajoutez un caractère de remplacement à un mot racine, coupez le mot au dernier caractère qui apparaît dans toutes ses variantes.
      1. augmentation* (avec le tion avant l'astérisque) obtiendra augmentation, augmentations, mais il n'obtiendra PAS augmenterait ou augmenter 
      2. augment* (avec le t avant l'astérisque) obtiendront augmentation, augmentations, augmenter, augmenterait, etc.   
  2. Notez le nombre de résultats que vous récupérez (au moment du tournage, il y en avait 327) – c'est presque 5 fois le nombre de résultats récupérés à l'étape 2.
    1. Vous pourrez voir à chaque fois que l'expression bénéfice net ou bénéfices nets apparaît ainsi qu'à chaque fois que les ventes apparaissent à moins de 5 mots de la plupart des formes de croissance (croissance, croîs, croît, croissons, croissez, croissent, etc.) dans l'un de ces documents.
    2. Cette recherche utilise le caractère de remplacement - * - pour permettre différentes fins de mots

 

RECHERCHE D'ÉTUDE DE CAS, étape 5 : ajout de synonymes (en utilisant ou entre eux)

  1. Question :  « L'un de mes termes de recherche peut-il être remplacé par un autre mot qui pourrait être utilisé à sa place? »
  1. Revenez à votre recherche et modifiez la recherche sur bénéfice* net* and (croi* or augmentw/5 vente*), puis cliquez à nouveau sur Rechercher .
    1. Nous pouvons voir que le bénéfice net est un terme technique qui n'a pas de synonymes, et le mot ventes n'a pas de synonymes que nous accepterions dans ce contexte.
    2. Il n'en va pas de même pour croi*, qui pourrait être remplacé dans une phrase par augmenter, améliorer, accroître, grandir, etc. - même le non-synonyme doubler vous donnerait des résultats pertinents ("doubler les ventes" pourrait être aussi valable pour vous que "croître les ventes" )
    3. Prenez un moment et pensez non seulement aux synonymes littéraux, mais également à tout autre terme que vous accepteriez au même endroit, même s'il ne s'agit pas de synonymes littéraux.
  2. Notez le nombre de résultats que vous récupérez (au moment du tournage, il y en avait 860) – c'est plus de 11 fois le nombre de résultats récupérés à l'étape 2.
    1. Vous pourrez voir à chaque fois que le mot bénéfice net ou bénéfices nets apparaît ainsi qu'à chaque fois que ventes apparaît soit à moins de 5 mots de toute forme de croissance (croissance, croîs, croît, croissons, croissez, croissent , etc.) soit à moins de 5 mots de toute forme d'augmentation (augmente, augmentes, augmentons, augmentez, etc.) dans l'un de ces documents
    2. Cette recherche utilise 2 synonymes, séparés par un – ou –, pour permettre divers mots à la place de « croissance »
    3. Nous n'utilisons qu'un seul synonyme ci-dessus ( augment* ) , mais une recherche plus complète pourrait être quelque chose comme bénéfice* net* and (croi* or augment* or grandi* or accroît* or amélior* w/5 vente*)) - cela obtiendrait encore plus résultats

 

ÉTUDE DE CAS, CONCLUSIONS 

  1. Même la recherche la plus élémentaire, celle de l'étape 2 ci-dessus, élimine 90 % du bruit que vous auriez à parcourir sur SEDAR ou sur toute méthode s'appuyant sur Ctrl+F pour trouver des mots dans des documents.
  2. La recherche la plus spécifique, celle de l'étape 5 ci-dessus, utilise (1) un connecteur de proximité , (2) des caractères de remplacement et (3) des synonymes (séparés par un ou ), trouve plus de 11 fois plus de documents pertinents que la recherche de base. la recherche, la recherche à l'étape 2 ci-dessus, fait
  3. En triant les résultats par rang, vous commencerez par les résultats les plus pertinents (ceux qui contiennent les termes de recherche les plus fréquents et les plus étroitement regroupés) afin que vous n'ayez pas à regarder tous les 860 résultats, mais que vous puissiez simplement regarder les plus élevés /meilleurs correspondances parmi eux 
 

Pour rechercher avec des connecteurs

1.       Niveau d'introduction : assurez-vous d'être au moins familier avec les 5 premiers connecteurs du tableau ci-dessous ([espace], ET, OU, ET NON, *)

a.       Regardez le 6ème connecteur (w/n) et demandez-vous s'il vous serait utile ou non de l'utiliser dans votre recherche. Si la réponse est non, vous n’aurez pas besoin d’en savoir plus sur la recherche de termes et de connecteurs qu’au niveau débutant.

2.       Niveau de base  : consultez la liste complète des connecteurs dans le tableau de Recherche des Termes de Base et des Connecteurs ci-dessous.

a.       Si vous constatez que vous n'avez aucune question sans réponse et que vous ne souhaitez pas en savoir plus, vous n'aurez besoin que d'un niveau de base.

3.       Niveaux intermédiaire et avancé : regardez le deuxième tableau ci-dessous – Termes et Connecteurs Intermédiaires et Avancés Recherche

a.       Les 3 premiers exemples sont intermédiaires et les 3 derniers sont des applications avancées de recherche de termes et de connecteurs.

                                                                     1.       Comprendre et utiliser la recherche de termes et de connecteurs intermédiaires et avancés vous donne beaucoup plus de pouvoir sur ce que vous regardez et vous permet d'éliminer beaucoup de bruit dans votre recherche.



Tableau n°1 : Recherche de Termes de Base et de Connecteurs   

(téléchargez ce tableau au format PDF en bas de cette page, l'explication vidéo suit le tableau)
 

Connecteur

Exemple

Récupère

Points forts

[espace]

région de constitution

Documents contenant exactement la même expression recherchée

 

EXCEPTION : certaines phrases nécessitent des guillemets pour être reconnues.

 

IMPORTANT : voir le connecteur ""  (guillemets) ci-dessous

 

L'expression exacte région d'incorporation

AND

mandat AND  considération 

Documents contenant les deux termes

Les deux termes peuvent se trouver n'importe où dans le document, indépendamment de leur proximité l'un par rapport à l'autre

 

OR

mandat OR  considération 

Documents contenant l'un ou l'autre terme OU les deux termes


L’un ou l’autre terme n’importe où dans le document

 

AND NOT

mandat

AND NOT 
considération 

Documents qui contiennent un terme mais ne doivent pas contenir l'autre

 

Seul le terme mandat et ne doit pas contenir le terme considération

*

mandat*

Documents contenant un terme commençant par une chaîne de caractères spécifiée

 

Tout terme commençant par « mandat » -  mandate, mandates, mandate, mandatons, mandatez, etc.

 

w/n

mandat

w/10 
considération 

Documents contenant un terme dans un certain nombre (n) de mots de l'autre terme

 

Permet toute combinaison de mots entre ces deux termes afin de ne rechercher aucune expression exacte en particulier.

 

Il recherche des termes qui font partie d’une idée, d’une conversation ou d’un sujet.


L'un ou l'autre terme chaque fois qu'il apparaît dans un certain nombre de mots de l'autre terme

pre/N

mandat 

pre/10 
considération 

Documents contenant un terme précédant l'autre terme d'un certain nombre (nde mots (ou moins que ce nombre de mots)


Tant mandat que l’examen sont à condition que mandat précède considération d’au plus 10 mots.

 

Si mandat comporte 11 mots avant d' considération, aucun des deux termes ne sera mis en évidence.

 

NOT w/n

mandat

NOT w/10 
considération 

Documents dans lesquels au moins une instance d'un terme apparaît sans que ce terme ne se trouve à une certaine distance d'un autre terme spécifié


Mandat et considération sont tous deux mis en évidence à condition que mandat précède considération de 10 mots ou moins. 

Si mandat précède de 11 mots considération, aucun des deux termes ne sera mis en évidence.

 

xfirstword

mandat

w/10
xfirstword

Spécifie l'emplacement du premier mot apparaissant dans le document. 

Combiné avec w/n, il permet de trouver les documents dans lesquels un terme apparaît à un certain nombre de mots du premier mot du document.

 

Chaque instance de "mandat " qui apparaît dans les 10 mots suivant le premier mot du document.

""

(guillemets)

"warranties 

and 
representations"


"incorporated or 

deemed to be incorporated"


"not limited to"

Documents contenant l'expression exacte recherchée, y compris la reconnaissance AND , OR , et NOT  comme termes normaux et non comme connecteurs


Inutile pour toutes les recherches de phrases en français car le français n'utilise pas ces mots.


Inutile pour la plupart des recherches de phrases en anglais.


Nécessaire uniquement lorsque la phrase exacte contient un mot qui est normalement un connecteur tel que "and", "or", "not" 


Chaque fois que and, or, et not sont enfermés dans "", ils seront traités comme des termes réguliers à rechercher et cesseront d'agir comme connecteurs dans cette phrase.


 

%

wa%rrant

Documents contenant des mots quelque peu similaires à warrant


Trouvera les fautes d'orthographe dewarrant telles que warant  et warrrant 

 



Vidéo n° 1 : Recherche de termes de base et de connecteurs  





Tableau n°2 : Recherche de Termes et de Connecteurs Intermédiaires et Avancés   
(téléchargez ce tableau au format PDF en bas de cette page, l'explication vidéo suit le tableau)


Niveau

Recherche

Retours

Points forts

Intermédiaire

(mandat and considération) or d'actions ordinaires


Les documents qui :

   1) Mentionner à la fois mandat et considération


   2) mais ne contiennent pas nécessairement d'actions ordinaires


OU BIEN documents qui :


   1) contiennent d'actions ordinaires


   2) mais qui ne contiennent pas nécessairement de bon de mandat ou de considération

 

Met en évidence toutes les occurrences de mandatconsidération, ou d'actions ordinaires trouvées dans les relations spécifiées dans la recherche.


mandat ne sera mis en évidence que si le terme considération figure dans le document.

Intermédiaire

mandat and (considération or d'actions ordinaires)

Les documents qui :


   1) contiennent un d'actions ordinaires


   2) et qui contiennent également SOIT une considération, soit d'actions ordinaires

 

Mettez en évidence toutes les occurrences de mandat , de considération ou d'actions ordinaires trouvées dans les relations spécifiées dans la recherche.

 

 

 

 

 

 

 

 

 

 

Intermédiaire

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Intermédiaire

(suite)

(mandat and considération) w/10 d'actions ordinaires

Les documents qui:


   1) contiennent mandat  

dans les 10 mots d'actions ordinaire


   2) Pour autant que le même document contienne également considération dans les 10 mots correspondant à d'actions ordinaires.    

1) Pour que "mandat" soit mis en évidence, il doit se trouver:


* dans les 10 mots d'actions ordinaires, et


* considération doit également se situer à moins de 10 mots d'actions ordinaires, sinon d'actions ordinaires ne sera pas mis en évidence.

 

* La distance entre mandat et considération n'a pas d'importance, bien qu'ils ne puissent logiquement pas être éloignés de plus de 20 mots l'un de l'autre, étant donné que chaque terme est limité à moins de 10 mots d'actions ordinaires.


2) Pour que considération soit mise en évidence, elle doit être


* à moins de 10 mots d'actions ordinaires, et


mandat doit également se situer à moins de 10 mots d'actions ordinaires, faute de quoi considération ne sera pas mise en évidence.


* La distance entre mandat et considération n'a pas d'importance, bien qu'ils ne puissent logiquement pas être éloignés de plus de 20 mots l'un de l'autre étant donné que chaque terme est limité à moins de 10 mots d'actions ordinaires.


3) Pour que d'actions ordinaires soient mises en évidence, elles doivent se trouver:


* à moins de 10 mots de mandat, ainsi qu'être


* à moins de 10 mots de considération, sinon d'actions ordinaires ne seront pas mises en évidence


* la distance entre mandat  et considération n'a pas d'importance, bien qu'ils ne puissent logiquement pas être éloignés de plus de 20 mots l'un de l'autre, étant donné que chaque terme est limité à moins de 10 mots d'actions ordinaires.

 

 

 

 

 

 

 

 

 

Avancé

d'actions ordinaires 

w/20 mandat 
w/10 considération

Les documents qui:

 

1) Contenir mandat  dans les 20 mots d'actions ordinaires


 2) contiennent mandat dans les 10 mots de considération

 3) contiennent également 

considération dans les 10 mots de d'actions ordinaires


Dans cette recherche, d'actions ordinaires, le premier terme tapé, est un terme d'ancrage et tous les connecteurs de proximité qui suivent dans cette chaîne s'appliquent comme une distance à partir de ce terme d'ancrage d'actions ordinaires. 


Il existe une deuxième condition:



mandat doit également se trouver dans les 10 mots de considération, en plus d'être dans les 10 mots du terme d'ancrage d'actions ordinaires.

À souligner -


   1) d'actions ordinaires doivent être:


* dans les 20 mots du mandat, ainsi qu'être


* dans les 10 mots de considération


   2) Mandat doit être:


* dans les 20 mots du terme d'ancrage "d'actions ordinaires", ainsi que


* dans les 10 mots de considération


   3) considération doit être :


* dans les 10 mots du terme d'ancrage d'actions ordinaires, ainsi que


* dans les 10 mots de mandat 

 

Avancé

d'actions ordinaires 

w/20 (mandat w/10 considération)

Documents qui:


1) contiennent mandat dans les 10 mots de considération

 

2) contiennent un mandat  OU, ENFIN, considération dans un rayon de 20 mots autour d'actions ordinaires


   3) la considération peut être n'importe quelle distance d'actions ordinaires tant que les deux conditions ci-dessus sont remplies.

A souligner - 


   1) d'actions ordinaires doivent être 


* dans les 20 mots du mandat, ou bien être 


* dans les 20 mots de la considération


   2) Le mandat doit être : 


* dans les 10 mots de la considération


* à moins de 20 mots du terme d'ancrage d'actions ordinaires SEULEMENT SI la considération n'est pas à moins de 20 mots du terme d'ancrage d'actions ordinaires.


   3) La considération doit être: 


* dans les 10 mots mandat , ainsi que 


* dans les 20 mots de l'ancre d'actions ordinaires SEULEMENT SI mandat  n'est pas dans les 20 mots de l'ancre d'actions ordinaires.


4) seul mandat  OU 
considération doit être dans les 20 mots du terme d'ancrage d'actions ordinaires.

Avancé

d'actions ordinaires 

w/10 mandat 
w/15 considération 
w/20 collectivement

Les documents qui contiennent: 


   1) d'actions ordinaires dans les 10 mots correspondant à d'actions ordinaires


   2) considération dans la limite de 15 mots d'actions ordinaires

 

   3) Collectivement dans un rayon de 20 mots d'actions ordinaires

En raison de la chaîne de connecteurs de proximité consécutifs (non interrompue par un AND, un OR ou un AND NOT), tout document renvoyé devra également contenir :

  

   1) mandat dans les 15 mots de considération

 

   2) considération within 20 words of collectivement


Dans cette recherche, d'actions ordinaires, premier terme saisi, constituent un terme d'ancrage et tous les connecteurs de proximité qui suivent dans cette chaîne s'appliquent à une distance spécifiée par rapport au terme d'ancrage d'actions ordinaires.  


Il existe une deuxième stipulation selon laquelle chaque terme AUSSI doit se trouver à une distance spécifiée du terme qui le suit, en fonction du connecteur de proximité utilisé (w/10, w/15, w20). 

À souligner - 


   1) d'actions ordinaires doivent être: 


* dans les 10 mots de mandat , ainsi que 


* dans les 15 mots de considération, et aussi être 


* dans les 20 mots de collectivement


   2) mandat  doit être : 


* dans les 10 mots de terme d'ancrage  d'actions ordinaires, ainsi que


* dans les 15 mots de considération


   3) La considération doit être : 


* dans les 15 mots du terme d'ancrage d'actions ordinaires, ainsi que 


* dans les 15 mots de mandat , et aussi être


* dans les 20 mots de collectivement


   4) Collectivement doit être : 


* dans les 20 mots de terme d'ancrage  d'actions ordinaires, ainsi que

* dans les 15 mots de considération



Video #2:   Intermediate Terms and Connectors Searching




Video #3:   Advanced Terms and Connectors Searching



 


    • Related Articles

    • Suggestions de termes de recherche issues de vos recherches précédentes

      Avantis héberge une solide collection de tous vos termes de recherche en texte intégral précédemment recherchés sous forme d'historique rapide dans la zone de recherche en texte intégral du volet de recherche et de la visionneuse de documents. Ceci ...
    • Recherche de contrats et d'accords – Bonnes pratiques

      Les contrats et accords peuvent être classés, ou même mal classés, dans plusieurs catégories de documents différentes. Pour en faire une recherche exhaustive, suivez les étapes décrites dans la vidéo ou l'article ci-dessous. Chaîne de recherche des ...
    • Affichage de documents et de données

      Vidéo - Exécuter votre première recherche Visionneuse de documents Voici les fonctionnalités de votre visionneuse de documents. Ce sont des options qui vous font gagner du temps et vous permettent de parcourir vos documents plus efficacement, en vous ...
    • Panneau de recherche

      Vidéo - Exécuter votre première recherche Panneau de recherche Voici les fonctionnalités de votre panneau de recherche. Articles 1, 3, 4 et 7 vous trouverez ci-dessous tout ce dont vous avez besoin pour lancer votre première recherche ! Choisissez un ...
    • Recherche de communiqués de presse historiques SEDAR et SEC (combinés)

      Avantis facilite la recherche simultanée de communiqués de presse dans la collection SEDAR et dans la collection SEC, mais il existe certaines distinctions inhérentes dans la stratégie entre les deux collections en raison de la nature des documents. ...