<?xml version="1.0" encoding="UTF-8" ?>
<modsCollection xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://www.loc.gov/mods/v3" xmlns:slims="http://slims.web.id" xsi:schemaLocation="http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-3.xsd">
<mods version="3.3" ID="518">
<titleInfo>
<title><![CDATA[Urgensi Penanganan Awal Pada Data Imbalance Untuk Meningkatkan Validitas Performa Klasifikasi Pada Kasus Identifikasi HIV&#47;AIDS dengan Fitur SMILES]]></title>
</titleInfo>
<name type="Personal Name" authority="">
<namePart>Erna Nurmalaty</namePart>
<role><roleTerm type="text">Pengarang</roleTerm></role>
</name>
<typeOfResource manuscript="yes" collection="yes"><![CDATA[mixed material]]></typeOfResource>
<genre authority="marcgt"><![CDATA[bibliography]]></genre>
<originInfo>
<place><placeTerm type="text"><![CDATA[Jakarta]]></placeTerm></place>
<publisher><![CDATA[Tanri Abeng University]]></publisher>
<dateIssued><![CDATA[2022]]></dateIssued>
<issuance><![CDATA[monographic]]></issuance>
<edition><![CDATA[0]]></edition>
</originInfo>
<language>
<languageTerm type="code"><![CDATA[id]]></languageTerm>
<languageTerm type="text"><![CDATA[Indonesia]]></languageTerm>
</language>
<physicalDescription>
<form authority="gmd"><![CDATA[Informatic Engineering]]></form>
<extent><![CDATA[]]></extent>
</physicalDescription>
<note>Dalam proses pembelajaran dengan Machine Learning, ketidakseimbangan data kelas pada dataset (imbalance data) dapat menyebabkan bias pada interpretasi performa pembelajaran. Hal ini terjadi dikarenakan model cenderung mempelajari kelas mayoritas. Oleh karena itu, proses klasifikasi pada data imbalance seringkali menghasilkan presisi dan recall yang cenderung rendah sedangkan nilai akurasi sangat tinggi. Kondisi ini menyebabkan ketidaktepatan penafsiran pada performa pembelajaran atau proses klasifikasi. Pada penelitian ini, kami mensimulasikan beberapa skenario untuk menunjukkan urgensi pengolahan awal data pada data imbalance untuk meningkatkan validitas performa klasifikasi. Kasus penelitian yang digunakan adalah identifikasi HIV/AIDS dengan menggunakan data SMILES. Metode sampling dan outlier detection diimplementasikan pada pengolahan data awal dan dilakukan evaluasi akan dampak perlakuan dua pendekatan tersebut terhadap performa klasifikasi (identifikasi). Hasil simulasi menunjukkan bahwa dengan menerapkan proses sampling pada dataset imbalance berhasil meningkatkan performa identifikasi HIV/AIDS dengan meningkatnya nilai presisi dan recall.</note>
<subject authority=""><topic><![CDATA[Imbalance dataset, pre-processing, sampling, outli]]></topic></subject>
<classification><![CDATA[]]></classification><identifier type="isbn"><![CDATA[]]></identifier><location>
<physicalLocation><![CDATA[Repository Files Documentation TANRI ABENG UNIVERSITY]]></physicalLocation>
<shelfLocator><![CDATA[]]></shelfLocator>
</location>
<recordInfo>
<recordIdentifier><![CDATA[518]]></recordIdentifier>
<recordCreationDate encoding="w3cdtf"><![CDATA[2023-03-06 16:05:24]]></recordCreationDate>
<recordChangeDate encoding="w3cdtf"><![CDATA[2023-03-06 16:11:33]]></recordChangeDate>
<recordOrigin><![CDATA[machine generated]]></recordOrigin>
</recordInfo></mods></modsCollection>