Abstract
Dans cet article, nous appuyant sur un corpus de 3 444 075 tweets correspondant à 44 107 210 tokens (mots, signes de ponctuation, émojis, émoticônes, etc.) recueillis en décembre 2016, nous nous intéressons aux procédés de segmentation à l’œuvre dans les tweets. Après avoir évoqué certaines caractéristiques de ces écrits particuliers, nous rappelons les procédés généraux de segmentation à l’écrit : les signes de ponctuation et les connecteurs. Nous nous penchons ensuite sur la segmentation opérée dans les tweets par ces deux procédés généraux. Enfin, nous montrons que les émoticônes et les émojis constituent des procédés spécifiques permettant de diversifier les stratégies de segmentation des utilisateurs de tweets (et d’autres écrits numériques, tels les SMS et les courriels).