Section author: Sebastian Jentschke

வெளியீட்டாளர்களை எவ்வாறு அடையாளம் காண்பது மற்றும் பகுப்பாய்வுகளில் பயன்படுத்தப்படுவதிலிருந்து அவற்றை எவ்வாறு வடிகட்டுவது?

Outliers_Filter_Shortcut

  • `` தரவு` தாவலைத் திறந்து `` வடிகட்டி`` என்பதைத் தேர்ந்தெடுக்கவும் (ஐகான் பட்டியில் உள்ள சின்னத்தைப் பயன்படுத்துவதன் மூலம் அல்லது சாமோவி சாளரத்தின் கீழ்-இடது மூலையில் ஒன்றைப் பயன்படுத்துவதன் மூலம்)
    செயல்பாடுகளை அணுக, வடிகட்டி அமைப்புகளில் `` fx`` ஐகானை அழுத்தவும்
    வடிகட்டியை நீங்கள் செயல்படுத்த அல்லது செயலிழக்கச் செய்யக்கூடிய ஒரு சுவிட்சும் உள்ளது (கீழே உள்ள கருத்தை கீழே காண்க)
    மேல்-வலது மூலையில் அம்புக்குறியை அழுத்துவதன் மூலம் வடிகட்டி அமைப்புகளை மூடுகிறீர்கள்
  • வெளிநாட்டினரை விலக்க மூன்று பெரிய அணுகுமுறைகள் உள்ளன:
    1. Z- மதிப்பெண்களின் அடிப்படையில் (முழுமையான மதிப்பு பெரியதாக இருக்க வேண்டும் 3.3; இது 0.1% = 1 /1000 நிகழ்தகவுக்கு சமம்; ஒரு நிலையான இயல்பான விநியோகத்தின் அடிப்படையில் ~ அளவுரு)

    2. IQR ஐ அடிப்படையாகக் கொண்டு (ஒரு பெட்டி சதித்திட்டத்தைப் போல; அணிகள் மற்றும் அளவுகளை அடிப்படையாகக் கொண்டது ~ அளவுரு அல்லாதது)

    3. மஆலனோபிச் தூரத்தின் அடிப்படையில் (பன்முக வெளிநாட்டவர்கள்)

    for 1. and 2., there exist functions in jamovi (see next bullet points), for 3. you have to use R-code (decribed two bullet point below); for 2. you could also do it visually (three bullet points below)
  • நீங்கள் ஒரு செயல்பாட்டு அடிப்படையிலான தேர்வைப் பயன்படுத்தலாம்; Z- மதிப்பெண்கள் (முதல் வரி), இடைநிலை வரம்பு (IQR, இரண்டாவது வரி) அல்லது சில வரிசைகள் / வரிசை எண்களைத் தவிர்ப்பதன் மூலம் (எ.கா. கீழே மூன்றாவது வரி:
    MAXABSZ([VARIABLE1], [VARIABLE2], …)
    
    MAXABSIQR([VARIABLE1], [VARIABLE2], …)
    
    IFMISS(MATCH(ROW(), [ROWNUMBER 1], [ROWNUMBER 2], …), 1, 0)
    

    Outliers_Filter_Settings

    பின்வரும் குறியீடு எடுத்துக்காட்டு மஅலானோபிச் தூரத்தின் அடிப்படையில் பன்முக வெளியீட்டாளர்களைக் கண்டறிகிறது (வி.எல் இல் மாறி பெயர்களை சரிசெய்ய நினைவில் கொள்ளுங்கள்)
    # this list should contain the names of your INDEPENDENT VARIABLES
    # you should not include your dependent variables
    # if you already use a filter set it to inactive
    # hint: you can get the names of your variable with names(data)
    # the syntax is adjusted for jamovi (the data frame is called data,
    # but can easily be used within R by just changing data to the name of your data frame
    VL = c('dan.sleep', 'baby.sleep', 'day')
    # brief explanation: the code calculates the Mahalanobis distance for all variables in VL,
    # then calculates the p-value (pchisq) and show lines with variables that had a p-value < 0.001
    row.names(data)[
        pchisq(unname(
            mahalanobis(data[, VL], colMeans(data[, VL]), cov(data[, VL]))),
            df=length(VL), lower.tail=FALSE) < 0.001]
    
    `` r``-குறியீட்டிலிருந்து வெளியீடு நீங்கள் எந்த வரிகளைத் தேர்ந்தெடுக்க வேண்டும் என்பதை உங்களுக்குக் கூறுகிறது
    நீங்கள் `ஆர்.சே. எடிட்டர் <சாமோவி-மோட்யூல்_ஆர்சே> __ __ க்குள் ச்கிரிப்ட்களைப் பயன்படுத்துகிறீர்கள், அவற்றை நகலெடுத்து ஒட்டவும், ►-பட்டனை (சிறிய பச்சை முக்கோணம்) தாக்கி அவற்றை இயக்கவும்
  • வடிகட்டி நிலைமைகளை பூலியன் `` மற்றும்`` / அல்லது` ஐப் பயன்படுத்தி இணைக்கலாம்:
    MAXABSZ([VARIABLE1], [VARIABLE2], …) < 3.3 and
    MAXABSIQR([VARIABLE1], [VARIABLE2], …) < 3 and
    IFMISS(MATCH(ROW(), [ROWNUMBER 1], [ROWNUMBER 2], …), 1, 0)
    
  • இரண்டாவது வரியைப் பயன்படுத்துவதற்குப் பதிலாக (`` maxabsiqr`) தரவுத்தொகுப்பில் அந்தந்த வரிசை எண்களைத் தவிர்ப்பதன் மூலம் வழக்குகளைத் தேர்ந்தெடுக்கலாம் (மூன்றாவது வரியைப் போல; பின்னர் நீங்கள்` கீழ் பெட்டி-அடுக்குகளில் உள்ள வெளிநாட்டினரை பார்வைக்கு சரிபார்க்கிறீர்கள் விளக்கங்கள்`, டிக் பாக்ச்` லேபிள் வெளியீட்டாளர்கள்` அமைக்கப்பட்டிருப்பதை உறுதிசெய்து, வெளிநாட்டவர்கள் எனக் குறிக்கப்பட்ட வரிசை எண்களை விலக்கவும்)