La recherche avec des connecteurs tels que
and,
or, ou
w/5
entre vos termes de recherche est appelée
recherche de termes et de connecteurs
. C'est une bonne stratégie à utiliser lorsque vous avez besoin d'être plus précis dans la langue que vous recherchez. Vous trouverez ci-dessous des instructions étape par étape ainsi que quelques vidéos pour vous aider à démarrer la recherche en texte intégral.
RÉSUMÉ:
Dans l'étude de cas suivante, nous effectuons une recherche de base à travers 5 étapes différentes sur l'échelle simplicité-complexité et voyons l'effet qu'elle a sur nos résultats réels. Cette étude de cas suit exactement le même exemple couvert dans la vidéo ci-dessus «Dans quelle mesure les recherches en texte intégral sont-elles vraiment utiles ? » Nous vous conseillons également de faire défiler vers le bas pour afficher les tableaux des connecteurs de recherche pour débutants, intermédiaires et avancés (ou de les télécharger au format PDF à l'adresse au bas de cet article) pour des explications complètes sur le fonctionnement des connecteurs dans les recherches.
RECHERCHE D'ÉTUDE DE CAS, étape 1 : catégories mais pas de termes de recherche
- Nous commençons par une simple recherche de tous les états financiers des sociétés de produits de consommation et de produits industriels.
- Dans l'ensemble de données Dépôts SEDAR , ajoutez les critères Industrie et Catégorie de dépôt s'ils ne sont pas déjà ajoutés en cliquant sur le lien + Ajouter des critères en haut à gauche de votre écran.
- Dans Industrie , ajoutez les produits de consommation et les produits industriels.
- Dans la catégorie de dépôt , ajoutez les états financiers
- Dans Date de dépôt , ajoutez les 2 dernières années
- Cliquez sur Rechercher
- Vous obtiendrez 1000 résultats
- Il s'agit de nombreux états financiers mais nous ne savons pas s'ils parlent de ce qui nous intéresse : le bénéfice net et la croissance des ventes.
- Nous pouvons cliquer sur chaque résultat et rechercher ces termes document par document, comme en utilisant Ctrl+F sur un dépôt SEDAR depuis sedar.com.
- Cette récupération n'a pas de composant de recherche en texte intégral
RECHERCHE D'ÉTUDE DE CAS, étape 2 : ajouter des termes de recherche et utiliser and
- Question : « Dois-je trouver des mots ou des phrases spécifiques dans ces documents? »
- Revenez à votre écran de recherche et ajoutez les mots-clés bénéfice net and croissance des ventes à votre recherche et cliquez à nouveau sur Rechercher (vous pouvez copier et coller la recherche à partir d'ici)
- Vous disposez maintenant de deux expressions exactes (les mots séparés par des espaces sont des expressions exactes) qui doivent apparaître dans le document (« and » indique que les deux expressions doivent être présentes dans le document mais ne précise aucune relation entre elles).
- Notez le nombre de résultats que vous récupérez (au moment du tournage de cette vidéo c'était 74 résultats)
- Vous pourrez cliquer sur chaque résultat et voir automatiquement à tout moment que soit bénéfice net, soit croissance des ventes apparaissent dans chaque dépôt.
- Le résultat de 74 signifie que 926 (92,6 %) des résultats de votre première recherche n'étaient pas pertinents et étaient essentiellement du bruit.
- Cette simple recherche vous a déjà fait gagner 90 % du temps que vous passeriez si vous n'utilisiez aucune recherche en texte intégral, mais il lui manque toujours la majorité des résultats valides.
- Cette recherche utilise le connecteur et – and – pour spécifier plus d’un mot ou une expression à trouver
RECHERCHE D'ÉTUDE DE CAS, étape 3 : ajout d'un connecteur de proximité
- Question : « Certaines de mes expressions sont-elles trop spécifiques ? »
- Question : « Est-ce que je recherche des termes de recherche à inclure dans la même discussion mais pas nécessairement pour constituer une expression exacte? »
- Revenez à votre recherche et modifiez la recherche en bénéfice net and (croissance w/5 vente) et cliquez à nouveau sur Rechercher
- Cela permet de remplacer l'expression croissance des ventes par n'importe quelle expression incluant ventes et croissance à moins de 5 mots l'une de l'autre.
- Ceci n'est pas directionnel, vous obtiendrez donc croissance des ventes internationales, ainsi qu'une croissance des ventes intérieures, croissance des ventes au quatrième trimestre, entre autres variations.
- Notez le nombre de résultats que vous récupérez (au moment du tournage, il y en avait 182) – c'est plus du double du nombre de résultats récupérés à l'étape 2.
- Cette recherche utilise le connecteur de proximité – w/n – (où n serait remplacé par n'importe quel nombre compris entre 1 et 5000, afin de limiter la distance maximale que vous accepterez entre le mot ou la phrase qui le précède et le mot ou la phrase qui le suit) pour s'assurer que les termes sont liés ou proches les uns des autres
RECHERCHE D'ÉTUDE DE CAS, étape 4 : ajout d'un caractère de remplacement
- Question : « Ai-je besoin de variations sur les formes exactes de mes termes de recherche, telles que les pluriels ou les temps ? »
- Revenez à votre recherche et modifiez la recherche sur bénéfice* net* and (croi* w/5 vente*), puis cliquez à nouveau sur Rechercher .
- Cela vous permettra d'obtenir un bénéfice net ainsi que des bénéfices nets et également de croître ainsi que croîs, croît, croissons, croissez, et croissent, mais il n'obtiendra PAS grandir (pour grandir , vous devez l'ajouter comme synonyme à l'étape 5 ci-dessous, puisqu'il ne commence pas par les mêmes quatre lettres que croi*)
- Quand vous ajoutez un caractère de remplacement à un mot racine, coupez le mot au dernier caractère qui apparaît dans toutes ses variantes.
- augmentation* (avec le tion avant l'astérisque) obtiendra augmentation, augmentations, mais il n'obtiendra PAS augmenterait ou augmenter
- augment* (avec le t avant l'astérisque) obtiendront augmentation, augmentations, augmenter, augmenterait, etc.
- Notez le nombre de résultats que vous récupérez (au moment du tournage, il y en avait 327) – c'est presque 5 fois le nombre de résultats récupérés à l'étape 2.
- Vous pourrez voir à chaque fois que l'expression bénéfice net ou bénéfices nets apparaît ainsi qu'à chaque fois que les ventes apparaissent à moins de 5 mots de la plupart des formes de croissance (croissance, croîs, croît, croissons, croissez, croissent, etc.) dans l'un de ces documents.
- Cette recherche utilise le caractère de remplacement - * - pour permettre différentes fins de mots
RECHERCHE D'ÉTUDE DE CAS, étape 5 : ajout de synonymes (en utilisant ou entre eux)
- Question : « L'un de mes termes de recherche peut-il être remplacé par un autre mot qui pourrait être utilisé à sa place? »
- Revenez à votre recherche et modifiez la recherche sur bénéfice* net* and (croi* or augment* w/5 vente*), puis cliquez à nouveau sur Rechercher .
- Nous pouvons voir que le bénéfice net est un terme technique qui n'a pas de synonymes, et le mot ventes n'a pas de synonymes que nous accepterions dans ce contexte.
- Il n'en va pas de même pour croi*, qui pourrait être remplacé dans une phrase par augmenter, améliorer, accroître, grandir, etc. - même le non-synonyme doubler vous donnerait des résultats pertinents ("doubler les ventes" pourrait être aussi valable pour vous que "croître les ventes" )
- Prenez un moment et pensez non seulement aux synonymes littéraux, mais également à tout autre terme que vous accepteriez au même endroit, même s'il ne s'agit pas de synonymes littéraux.
- Notez le nombre de résultats que vous récupérez (au moment du tournage, il y en avait 860) – c'est plus de 11 fois le nombre de résultats récupérés à l'étape 2.
- Vous pourrez voir à chaque fois que le mot bénéfice net ou bénéfices nets apparaît ainsi qu'à chaque fois que ventes apparaît soit à moins de 5 mots de toute forme de croissance (croissance, croîs, croît, croissons, croissez, croissent , etc.) soit à moins de 5 mots de toute forme d'augmentation (augmente, augmentes, augmentons, augmentez, etc.) dans l'un de ces documents
- Cette recherche utilise 2 synonymes, séparés par un – ou –, pour permettre divers mots à la place de « croissance »
- Nous n'utilisons qu'un seul synonyme ci-dessus ( augment* ) , mais une recherche plus complète pourrait être quelque chose comme bénéfice* net* and (croi* or augment* or grandi* or accroît* or amélior* w/5 vente*)) - cela obtiendrait encore plus résultats
ÉTUDE DE CAS, CONCLUSIONS
- Même la recherche la plus élémentaire, celle de l'étape 2 ci-dessus, élimine 90 % du bruit que vous auriez à parcourir sur SEDAR ou sur toute méthode s'appuyant sur Ctrl+F pour trouver des mots dans des documents.
- La recherche la plus spécifique, celle de l'étape 5 ci-dessus, utilise (1) un connecteur de proximité , (2) des caractères de remplacement et (3) des synonymes (séparés par un ou ), trouve plus de 11 fois plus de documents pertinents que la recherche de base. la recherche, la recherche à l'étape 2 ci-dessus, fait
- En triant les résultats par rang, vous commencerez par les résultats les plus pertinents (ceux qui contiennent les termes de recherche les plus fréquents et les plus étroitement regroupés) afin que vous n'ayez pas à regarder tous les 860 résultats, mais que vous puissiez simplement regarder les plus élevés /meilleurs correspondances parmi eux
1. Niveau d'introduction : assurez-vous d'être au moins familier avec les 5 premiers connecteurs du tableau ci-dessous ([espace], ET, OU, ET NON, *)
a. Regardez le 6ème connecteur (w/n) et demandez-vous s'il vous serait utile ou non de l'utiliser dans votre recherche. Si la réponse est non, vous n’aurez pas besoin d’en savoir plus sur la recherche de termes et de connecteurs qu’au niveau débutant.
2. Niveau de base : consultez la liste complète des connecteurs dans le tableau de Recherche des Termes de Base et des Connecteurs ci-dessous.
a. Si vous constatez que vous n'avez aucune question sans réponse et que vous ne souhaitez pas en savoir plus, vous n'aurez besoin que d'un niveau de base.
3. Niveaux intermédiaire et avancé : regardez le deuxième tableau ci-dessous – Termes et Connecteurs Intermédiaires et Avancés Recherche
a. Les 3 premiers exemples sont intermédiaires et les 3 derniers sont des applications avancées de recherche de termes et de connecteurs.
1.
Comprendre et utiliser la recherche de termes et de connecteurs intermédiaires et avancés vous donne beaucoup plus de pouvoir sur ce que vous regardez et vous permet d'éliminer beaucoup de bruit dans votre recherche.
Connecteur |
Exemple |
Récupère |
Points forts |
[espace] |
région de constitution |
Documents contenant exactement la même expression recherchée
EXCEPTION : certaines phrases nécessitent des guillemets pour être reconnues.
IMPORTANT : voir le connecteur "" (guillemets) ci-dessous
|
L'expression exacte région d'incorporation |
AND |
mandat AND considération |
Documents contenant les deux termes |
Les deux termes peuvent se trouver n'importe où dans le document, indépendamment de leur proximité l'un par rapport à l'autre
|
OR |
mandat OR considération |
Documents contenant l'un ou l'autre terme OU les deux termes |
L’un ou l’autre terme n’importe où dans le document
|
AND NOT |
mandat
AND NOT considération
|
Documents qui contiennent un terme mais ne doivent pas contenir l'autre
|
Seul le terme mandat et ne doit pas contenir le terme considération |
* |
mandat* |
Documents contenant un terme commençant par une chaîne de caractères spécifiée
|
Tout terme commençant par « mandat » - mandate, mandates, mandate, mandatons, mandatez, etc.
|
w/n |
mandat
w/10 considération
|
Documents contenant un terme dans un certain nombre (n) de mots de l'autre terme
Permet toute combinaison de mots entre ces deux termes afin de ne rechercher aucune expression exacte en particulier.
Il recherche des termes qui font partie d’une idée, d’une conversation ou d’un sujet. |
L'un ou l'autre terme chaque fois qu'il apparaît dans un certain nombre de mots de l'autre terme |
pre/N |
mandat pre/10 considération
|
Documents contenant un terme précédant l'autre terme d'un certain nombre (n) de mots (ou moins que ce nombre de mots) |
Tant mandat que l’examen sont à condition que mandat précède considération d’au plus 10 mots.
Si mandat comporte 11 mots avant d' considération, aucun des deux termes ne sera mis en évidence.
|
NOT w/n |
mandat
NOT w/10 considération
|
Documents dans lesquels au moins une instance d'un terme apparaît sans que ce terme ne se trouve à une certaine distance d'un autre terme spécifié |
Mandat et considération sont tous deux mis en évidence à condition que mandat précède considération de 10 mots ou moins. Si mandat précède de 11 mots considération, aucun des deux termes ne sera mis en évidence.
|
xfirstword |
mandat w/10
xfirstword
|
Spécifie l'emplacement du premier mot apparaissant dans le document. Combiné avec w/n, il permet de trouver les documents dans lesquels un terme apparaît à un certain nombre de mots du premier mot du document.
|
Chaque instance de "mandat " qui apparaît dans les 10 mots suivant le premier mot du document. |
"" (guillemets) |
"warranties and representations"
deemed to be incorporated"
|
Documents contenant l'expression exacte recherchée, y compris la reconnaissance
AND
,
OR
, et
NOT
comme termes normaux et non comme connecteurs |
Inutile pour toutes les recherches de phrases en français car le français n'utilise pas ces mots. Inutile pour la plupart des recherches de phrases en anglais. Nécessaire uniquement lorsque la phrase exacte contient un mot qui est normalement un connecteur tel que "and", "or", "not" Chaque fois que and, or, et not sont enfermés dans "", ils seront traités comme des termes réguliers à rechercher et cesseront d'agir comme connecteurs dans cette phrase. |
% |
wa%rrant |
Documents contenant des mots quelque peu similaires à
warrant |
Trouvera les fautes d'orthographe dewarrant telles que warant et warrrant
|
Niveau |
Recherche |
Retours |
Points forts |
Intermédiaire |
(mandat and considération) or d'actions ordinaires |
Les documents qui : 1) Mentionner à la fois mandat et considération 2) mais ne contiennent pas nécessairement d'actions ordinaires OU BIEN documents qui : 1) contiennent d'actions ordinaires 2) mais qui ne contiennent pas nécessairement de bon de mandat ou de considération
|
Met en évidence toutes les occurrences de mandat, considération, ou d'actions ordinaires trouvées dans les relations spécifiées dans la recherche.
mandat ne sera mis en évidence que si le terme considération figure dans le document. |
Intermédiaire |
mandat and (considération or d'actions ordinaires) |
Les documents qui : 1) contiennent un d'actions ordinaires 2) et qui contiennent également SOIT une considération, soit d'actions ordinaires
|
Mettez en évidence toutes les occurrences de mandat , de considération ou d'actions ordinaires trouvées dans les relations spécifiées dans la recherche. |
Intermédiaire
Intermédiaire (suite) |
(mandat and considération) w/10 d'actions ordinaires |
Les documents qui:
1) contiennent mandat dans les 10 mots d'actions ordinaire
2) Pour autant que le même document contienne également considération dans les 10 mots correspondant à d'actions ordinaires. |
1) Pour que "mandat" soit mis en évidence, il doit se trouver:
* dans les 10 mots d'actions ordinaires, et
* considération doit également se situer à moins de 10 mots d'actions ordinaires, sinon d'actions ordinaires ne sera pas mis en évidence.
* La distance entre mandat et considération n'a pas d'importance, bien qu'ils ne puissent logiquement pas être éloignés de plus de 20 mots l'un de l'autre, étant donné que chaque terme est limité à moins de 10 mots d'actions ordinaires.
2) Pour que considération soit mise en évidence, elle doit être
* à moins de 10 mots d'actions ordinaires, et
* mandat doit également se situer à moins de 10 mots d'actions ordinaires, faute de quoi considération ne sera pas mise en évidence.
* La distance entre mandat et considération n'a pas d'importance, bien qu'ils ne puissent logiquement pas être éloignés de plus de 20 mots l'un de l'autre étant donné que chaque terme est limité à moins de 10 mots d'actions ordinaires.
3) Pour que d'actions ordinaires soient mises en évidence, elles doivent se trouver:
* à moins de 10 mots de mandat, ainsi qu'être
* à moins de 10 mots de considération, sinon d'actions ordinaires ne seront pas mises en évidence
* la distance entre mandat et considération n'a pas d'importance, bien qu'ils ne puissent logiquement pas être éloignés de plus de 20 mots l'un de l'autre, étant donné que chaque terme est limité à moins de 10 mots d'actions ordinaires.
|
|
|
|
|
|
|
|
|
Avancé |
d'actions ordinaires w/20 mandat w/10 considération
|
Les documents qui:
1) Contenir mandat dans les 20 mots d'actions ordinaires 2) contiennent mandat dans les 10 mots de considération 3) contiennent également considération dans les 10 mots de d'actions ordinaires Dans cette recherche, d'actions ordinaires, le premier terme tapé, est un terme d'ancrage et tous les connecteurs de proximité qui suivent dans cette chaîne s'appliquent comme une distance à partir de ce terme d'ancrage d'actions ordinaires. Il existe une deuxième condition: mandat doit également se trouver dans les 10 mots de considération, en plus d'être dans les 10 mots du terme d'ancrage d'actions ordinaires.
|
À souligner -
1) d'actions ordinaires doivent être:
* dans les 20 mots du mandat, ainsi qu'être
* dans les 10 mots de considération
2) Mandat doit être:
* dans les 20 mots du terme d'ancrage "d'actions ordinaires", ainsi que
* dans les 10 mots de considération
3) considération doit être :
* dans les 10 mots du terme d'ancrage d'actions ordinaires, ainsi que
* dans les 10 mots de mandat
|
Avancé |
d'actions ordinaires w/20 (mandat w/10 considération)
|
Documents qui: 1) contiennent mandat dans les 10 mots de considération
2) contiennent un mandat OU, ENFIN, considération dans un rayon de 20 mots autour d'actions ordinaires 3) la considération peut être n'importe quelle distance d'actions ordinaires tant que les deux conditions ci-dessus sont remplies. | A souligner - 1) d'actions ordinaires doivent être * dans les 20 mots du mandat, ou bien être * dans les 20 mots de la considération 2) Le mandat doit être : * dans les 10 mots de la considération * à moins de 20 mots du terme d'ancrage d'actions ordinaires SEULEMENT SI la considération n'est pas à moins de 20 mots du terme d'ancrage d'actions ordinaires. 3) La considération doit être: * dans les 10 mots mandat , ainsi que * dans les 20 mots de l'ancre d'actions ordinaires SEULEMENT SI mandat n'est pas dans les 20 mots de l'ancre d'actions ordinaires. 4) seul mandat OU considération doit être dans les 20 mots du terme d'ancrage d'actions ordinaires. |
Avancé |
d'actions ordinaires w/10 mandat w/15 considération w/20 collectivement
|
Les documents qui contiennent: 1) d'actions ordinaires dans les 10 mots correspondant à d'actions ordinaires 2) considération dans la limite de 15 mots d'actions ordinaires
3) Collectivement dans un rayon de 20 mots d'actions ordinaires En raison de la chaîne de connecteurs de proximité consécutifs (non interrompue par un AND, un OR ou un AND NOT), tout document renvoyé devra également contenir :
1) mandat dans les 15 mots de considération
2) considération within 20 words of collectivement Dans cette recherche, d'actions ordinaires, premier terme saisi, constituent un terme d'ancrage et tous les connecteurs de proximité qui suivent dans cette chaîne s'appliquent à une distance spécifiée par rapport au terme d'ancrage d'actions ordinaires. Il existe une deuxième stipulation selon laquelle chaque terme AUSSI doit se trouver à une distance spécifiée du terme qui le suit, en fonction du connecteur de proximité utilisé (w/10, w/15, w20). |
À souligner - 1) d'actions ordinaires doivent être: * dans les 10 mots de mandat , ainsi que * dans les 15 mots de considération, et aussi être * dans les 20 mots de collectivement 2) mandat doit être : * dans les 10 mots de terme d'ancrage d'actions ordinaires, ainsi que * dans les 15 mots de considération 3) La considération doit être : * dans les 15 mots du terme d'ancrage d'actions ordinaires, ainsi que * dans les 15 mots de mandat , et aussi être * dans les 20 mots de collectivement 4) Collectivement doit être : * dans les 20 mots de terme d'ancrage d'actions ordinaires, ainsi que * dans les 15 mots de considération |