Spam reviews are increasingly appearing on the Internet to promote sales or defame competitors by misleading consumers with deceptive opinions. This paper proposes a co-training approach called CoSpa (Co-training for Spam review identification) to identify spam reviews by two views: one is the lexical terms derived from the textual content of the reviews and the other is the PCFG (Probabilistic Context-Free Grammars) rules derived from a deep syntax analysis of the reviews. Using SVM (Support Vector Machine) as the base classifier, we develop two strategies, CoSpa-C and CoSpa-U, embedded within the CoSpa approach. The CoSpa-C strategy selects unlabeled reviews classified with the largest confidence to augment the training dataset to retrain the classifier. The CoSpa-U strategy randomly selects unlabeled reviews with a uniform distribution of confidence. Experiments on the spam dataset and the deception dataset demonstrate that both the proposed CoSpa algorithms outperform the traditional SVM with lexical terms and PCFG rules in spam review identification. Moreover, the CoSpa-U strategy outperforms the CoSpa-C strategy when we use the absolute value of decision function of SVM as the confidence.
from #Medicine via ola Kala on Inoreader http://ift.tt/1QCFH5z
via IFTTT
Αρχειοθήκη ιστολογίου
-
►
2023
(138)
- ► Φεβρουαρίου (74)
- ► Ιανουαρίου (64)
-
►
2022
(849)
- ► Δεκεμβρίου (61)
- ► Σεπτεμβρίου (74)
- ► Φεβρουαρίου (65)
-
►
2021
(2936)
- ► Δεκεμβρίου (59)
- ► Σεπτεμβρίου (180)
- ► Φεβρουαρίου (325)
-
►
2020
(1624)
- ► Δεκεμβρίου (293)
- ► Σεπτεμβρίου (234)
- ► Φεβρουαρίου (28)
-
►
2019
(13362)
- ► Δεκεμβρίου (19)
- ► Σεπτεμβρίου (54)
- ► Φεβρουαρίου (5586)
- ► Ιανουαρίου (5696)
-
►
2018
(66471)
- ► Δεκεμβρίου (5242)
- ► Σεπτεμβρίου (5478)
- ► Φεβρουαρίου (4835)
- ► Ιανουαρίου (5592)
-
►
2017
(44259)
- ► Δεκεμβρίου (5110)
- ► Σεπτεμβρίου (5105)
-
▼
2016
(7467)
- ► Δεκεμβρίου (514)
- ► Σεπτεμβρίου (1038)
-
▼
Μαρτίου
(699)
-
▼
Μαρ 09
(21)
- Burden of disease and patient-reported outcomes in...
- Nutrients, Vol. 8, Pages 150: Clinical Evaluation ...
- IJERPH, Vol. 13, Pages 302: Meta-Analysis of Cardi...
- IJGI, Vol. 5, Pages 29: Extracting Stops from Nois...
- Nanomaterials, Vol. 6, Pages 45: Atomic Layer Depo...
- Materials, Vol. 9, Pages 182: Imaging Water Thin F...
- Sinusitis, Vol. 1, Pages 44-48: Chronic Rhinosinus...
- Cardiorespiratory fitness and cognitive functionin...
- The psychometric properties of the Turkish Stroke ...
- IJMS, Vol. 17, Pages 349: MicroRNAs in Osteoclasto...
- IJMS, Vol. 17, Pages 349: MicroRNAs in Osteoclasto...
- Sustainability, Vol. 8, Pages 250: Weighing Effici...
- Sensors, Vol. 16, Pages 348: The Design and Optimi...
- Energies, Vol. 9, Pages 175: Optimal Power Managem...
- Information, Vol. 7, Pages 12: CoSpa: A Co-trainin...
- Computed Tomographic Pulmonary Angiographic Findin...
- Association of Quadriceps Muscle Fat With Isometri...
- Multiphase Multi-Detector Row Computed Tomography ...
- Utility of MDCT MIP Postprocessing Reconstruction ...
- Evaluating the Microcirculation of Normal Extraocu...
- Intravoxel Incoherent Motion Diffusion Weighted Ma...
-
▼
Μαρ 09
(21)
- ► Φεβρουαρίου (793)
Αναζήτηση αυτού του ιστολογίου
Τετάρτη 9 Μαρτίου 2016
Information, Vol. 7, Pages 12: CoSpa: A Co-training Approach for Spam Review Identification with Support Vector Machine
Εγγραφή σε:
Σχόλια ανάρτησης (Atom)
-
Αλέξανδρος Γ. Σφακιανάκης Medicine by Alexandros G. Sfakianakis,Anapafseos 5 Agios Nikolaos 72100 Crete Greece,00302841026182,0030693260717...
-
heory of COVID-19 pathogenesis Publication date: November 2020Source: Medical Hypotheses, Volume 144Author(s): Yuichiro J. Suzuki ScienceD...
-
https://ift.tt/2MQ8Ai8
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου
Σημείωση: Μόνο ένα μέλος αυτού του ιστολογίου μπορεί να αναρτήσει σχόλιο.