Bilim Türkiye’de Covid19 Gerçek Vaka Sayısının Tespiti için Bir Araştırma...

Türkiye’de Covid19 Gerçek Vaka Sayısının Tespiti için Bir Araştırma Önerisi – Rastgele Örneklem Alma

-

 

COVID19 pandemik hastalığın yayılma hızının kontrol edilmesi, azaltılması ve bunlara bağlı olarak sağlık hizmetlerinin aksatılmadan verilmesi için salgının ülkede kaç kişiye bulaştığının tahmin edilmesi faydalı olabilir. Türkiye’de Covid19 Gerçek Vaka Sayısının Tespiti için Bir Araştırma Önerisi – Rastgele Örneklem Alma

Bu çalışmada, bu tahminin yapılması için probabilistic sampling yöntemi kullanarak sağlık taramalarında test edilecek kişilerin seçilmesi önerilmektedir. Yapay verilerle yapılan ön çalışmalar, yapılacak COVID19 teşhislerinin 100 % doğru olduğu varsayılarak, rastgele 10.000 veya daha fazla kişiyle yapılacak sağlık tarama çalışmalarının Türkiye’deki COVID19 vaka sayısını doğru tahmin edeceğini göstermektedir. Covid19 Gerçek Vaka Sayısı Rastgele Örneklem Alma

1.ARAŞTIRMA KONUSU VE ÖNERİSİ

COVID19 virüsü 2020 yılında Dünya Sağlık Örgütü tarafından bir pandemik hastalık (Yiğit, 2020) olarak ilan edilmiştir. Bu pandemik hastalığın yayılma hızının kontrol edilmesi, azaltılması ve bunlara bağlı olarak sağlık hizmetlerinin aksatılmadan verilmesi için salgının ülkede kaç kişiye bulaştığının tahmin edilmesi önemlidir.

Bunun için en etkili yöntem, ülkedeki vatandaşların COVID19 teşhis testlerine erişebilmesi ve testleri yaptırabilmesidir. Ancak, (i) mevcut test imkanları veya (ii) testi değerlendirecek sağlık personeli sayısı, bütün vatandaşların COVID19 testlerini yaptırması için yeterli olmayabilir. Bu durumda nüfus üzerinde yapılan genel sağlık taramaları hastalığın nüfusta ne kadar yayıldığına dair ön bilgi verebilir.

Ancak, bu genel taramalarda test edilecek kişilerin sayısı ve nasıl seçileceği, taramaların nüfustaki gerçek sonucu temsil edip etmeyeceğini belirleyici etkenlerdir. Bu dökümanda probabilistic sampling yöntemi kullanarak taramalarda test edilecek kişilerin seçilmesi önerilmektedir. Probabilistic sampling yöntemlerinde, bir popülasyonda her kişinin numuneye katılma olasılığı eşit tutulmak zorundadır.

Bu şekilde seçilen numunelerin tarafsız sonuç vermesi, dolayısıyla küçük numune boyutlarıyla popülasyonun temsil edilebilmesi mümkün olmaktadır (Basin et al., 2018; Chaum, 2017; Sturgis et al., 2018). Dökümanın appendix-1 kısmında probabilistic sampling yöntemi içeren örnek bir manuscript hazırlanmıştır. Ayrıca, bazı yapay veriler kullanılarak, nüfusdaki COVID19 vaka sayısını doğru olarak tahmin edebilmek için taramada rastgele seçilmesi gereken kişi sayısı ile ilgili bazı tavsiyelerde bulunulmaktadır.

2. ÖN ÇALIŞMA METODOLOJİSİ

Ön çalışma için öncelikle 85,000,000’luk bir nüfus matrisi oluşturulmuştur. Bu matriste covid19 vakaları (covid19 pozitif) ‘1’ sayısıyla ve vaka bulunmayan kişiler ‘0’ sayısıyla temsil edilmektedir. Nüfüsta beklenen COVID19 pozitif yüzdesine göre bu yapay matris oluşturulduktan sonra, bu matrisden MATLAB’daki DATASAMPLE fonksiyonu kullanılarak istenilen boyutta rastgele numuneler seçilmiştir.

Seçilen her bir kişi, aynı numuneye tekrardan seçilmemektedir. Rastgele numune seçmek için DATASAMPLE içine gömülü bulunan Mersenne-Twister algoritması (Matsumoto and Nishimura, 1998) kullanılmıştır. Elde edilen eşit boyuttaki numunelerde COVID19 pozitif yüzdeleri belirlenerek, tahmin edilen bu yüzdelerin kümülatif dağılımları çıkarılmıştır. Üstte bahsedilen bu metodoloji için hazırlanan MATLAB kodu, appendix-2’de sunulmaktadır.

3. ÖN BULGULAR

Şekil 1’de, nüfusun % 1 inde COVID19 olduğu varsayılarak, rastgele numune boyutları ile yapılan tarama çalışmalarında çıkan sonuçların kümülatif dağılımı gösterilmektedir. Sonuçlar, 100’er ve 1000’er kişilik rastgele test gruplarında dağılımların asimetrik ve geniş aralıklarda bulunacağını göstermektedir.

Özellikle 100’er kişilik taramalarda dağılımın maksimum limitin % 9 a kadar çıkma ihtimali olduğu için, bu küçük numune boyutlarıyla yapılacak sağlık taramaları COVID19 yayılımının yüksek olacağına dair yanlış tahminlere sebep olabilir. Ancak, aynı şekil, 10.000 kişiden fazla oluşturulan rastgele gruplarda dağılımın hem simetrik hem de dar bir aralıkta (% 0.5 – % 1.5) sonuç vereceği beklenmektedir.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Şekil 1 Nüfusun % 1 inde COVID19 olduğu varsayılarak, yapay popülasyon üzerinde rastgele numune boyutları ile yapılan tarama çalışmalarında çıkabilecek sonuçların kümülatif dağılımı

Şekil 2’de, nüfusun % 5 inde COVID19 olduğu varsayılarak, rastgele numune boyutları ile yapılan bir milyon tarama çalışmasında çıkan sonuçların kümülatif dağılımı gösterilmektedir. Sonuçlar, Şekil 1’de de görüldüğü gibi, 100’er kişilik rastgele test gruplarında dağılımların asimetrik ve geniş aralıklarda bulunacağını göstermektedir.

1000’er kişilik test gruplarında ise dağılım simetrik olmakta ancak geniş bir aralığa yayılmaktadır. Dolayısıyla, 1000’er kişilik rastgele tarama grupları COVID19’un Türkiye’de kaç kişide bulunduğuna dair yanıltıcı bilgi verebilir. Ancak, 10.000 kişiden oluşturulan rastgele gruplarda dağılımın hem simetrik hem de oldukça dar bir aralıkta (% 4 – % 6) sonuç vermektedir.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Şekil 2 Nüfusun % 5 inde COVID19 olduğu varsayılarak, yapay popülasyon üzerinde rastgele numune boyutları ile yapılan tarama çalışmalarında çıkabilecek sonuçların kümülatif dağılımı

Şekil 3’de, nüfusun % 10 unda COVID19 olduğu varsayılarak, rastgele numune boyutları ile yapılan bir milyon tarama çalışmasında çıkacak muhtemel COVID pozitif sonuçların kümülatif dağılımı gösterilmektedir.

Sonuçlar, sadece 100’er kişilik rastgele test gruplarında dağılımların asimetrik ve geniş aralıklarda bulunacağını göstermektedir. 1000’er kişilik taramalarda dağılım simetrik olmakla birlikte dağılım aralığı (% 5.5 – % 15) gene yüksek olmaktadır. Ancak 10.000 kişiden fazla oluşturulan rastgele gruplarda yapılacak tarama sonuçları dağılımın hem simetrik hem de oldukça dar bir aralıkta (% 8.5 – % 11.5)  sonuç vereceği görülmektedir.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Şekil 3 Nüfusun % 10 unda COVID19 olduğu varsayılarak, yapay popülasyon üzerinde rastgele numune boyutları ile yapılan tarama çalışmalarında çıkabilecek sonuçların kümülatif dağılımı

Şekil 4’de, nüfusun % 20 sinde COVID19 olduğu varsayılarak, rastgele numune boyutları ile yapılan bir milyon tarama çalışmasında çıkacak muhtemel COVID pozitif sonuçların kümülatif dağılımı gösterilmektedir.

Sonuçlar, Şekil 3’de görüldüğü gibi  100’er kişilik rastgele test gruplarında dağılımların asimetrik ve geniş aralıklarda bulunacağını, 1000’er kişilik gruplarda dağılımların simetrik fakat geniş aralıklarda bulunacağını, 10.000’er kişilik gruplarda ise simetrik ve dar bir aralıkta (% 18 – % 22) olacağını göstermektedir.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Şekil 4 Nüfusun % 20 inde COVID19 olduğu varsayılarak, yapay popülasyon üzerinde rastgele numune boyutları ile yapılan tarama çalışmalarında çıkabilecek sonuçların kümülatif dağılımı

Şekil 5’de, nüfusun % 30 unda COVID19 beklendiği varsayılarak, rastgele numune boyutları ile yapılan bir milyon tarama çalışmasında çıkacak muhtemel COVID pozitif sonuçların kümülatif dağılımı gösterilmektedir.

Sonuçlar, farklı boyutlardaki bütün test gruplarında dağılımların simetrik aralıkta bulunmasına rağmen, sadece  10.000’er kişilik test gruplarında ise dağılımın dar bir aralığa (% 27.75 – % 32.25) düşeceği görülmektedir.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Şekil 5 Nüfusun % 30 unda COVID19 olduğu varsayılarak, yapay popülasyon üzerinde rastgele numune boyutları ile yapılan tarama çalışmalarında çıkabilecek sonuçların kümülatif dağılımı

Covid19 Gerçek Vaka Sayısının Tespiti Rastgele Örneklem Alma

4. TARTIŞMA

Yapay veriyle yapılan çalışmalar aşağıdaki bulgulara işaret etmektedir:

  • Eğer ülkedeki gerçek COVID19 vaka sayısı az ise, rastgele fakat az sayıda seçilecek kişi ile yapılan taramalarda tahmin edilen COVID19 vaka yüzdesi gerçek değerin üstünde çıkabilir (Şekil 1 – Şekil 4’de 100 kişiyle yapılan tarama sonuçlarının dağılımı). Bu ise tarama sonucunda COVID19 yayılımının çok olduğuna dair yanlış bir kanı oluşturulabilir. Ancak tarama yapılacak kişi sayısının artması bu sorunu ortadan kaldırmaktadır.
  • Tarama yapılacak rastgele kişi sayısınnın 1000 olması dağılımın simetrik olmasına yani ölçümün beklenenden yüksek COVID19 vaka sayısı tahmin etmesini engellemektedir. Kişi sayısı 10.000’e çıktığı zamansa hem dağılım tarafsız olacak hem de tahmin edilen COVID19 hasta sayısı, toplumdaki gerçek COVID19 hasta sayısına yakın değer verecektir. Dolayısıyla rastgele seçilen 10.000 veya daha fazla kişi ile yapılacak genel tarama testlerinin, ülkedeki gerçek COVID19 vaka tahmini ile doğru bilgi vermesi beklenmektedir.
  • Vakaları tespit etmek için kullanılacak testlerin doğruluğunun yüksek olması gerekmektedir. Bu ön çalışmada, testlerin 100 % doğru sonuç verdiği varsayılmıştır. Eğer test sonuçlarının güvenirliği düşük ise, bu çalışmanın bahsedilen güvenirliği dikkate alarak yeniden yapılması gerekir. Covid19 Rastgele Örneklem Alma

5. SONUÇ

Bu araştırma önerisinde ülke genelinde COVID19 vaka sayısınının doğru tahmini için, rastgele seçilecek  kişilerle sağlık taramaları yapılması önerilmektedir. Yapılan ön çalışmalar, test sonuçlarının 100 % doğru olduğu varsayılarak, rastgele 10.000 veya daha fazla kişiyle yapılacak tarama çalışmalarının ülkedeki COVID19 vaka sayısını doğru tahmin edeceğini göstermektedir.

Covid19 Gerçek Vaka Sayısının Tespiti Rastgele Örneklem Alma

KAYNAKÇA

Basin, D., Radomirovic, S., Schmid, L., 2018. Alethea: A Provably Secure Random Sample Voting Protocol, in: 2018 IEEE 31st Computer Security Foundations Symposium (CSF). IEEE, pp. 283–297. https://doi.org/10.1109/CSF.2018.00028

Brick, J.M., Tucker, C., 2007. Mitofsky Waksberg: Learning From The Past. Public Opin. Q. 71, 703–716. https://doi.org/10.1093/poq/nfm049

Chaum, D., 2017. Random-Sample Elections [WWW Document].

Kim, H., Jang, S.M., Kim, S.-H., Wan, A., 2018. Evaluating Sampling Methods for Content Analysis of Twitter Data. Soc. Media + Soc. 4, 1–10. https://doi.org/10.1177/2056305118772836

L’Engle, K., Sefa, E., Adimazoya, E.A., Yartey, E., Lenzi, R., Tarpo, C., Heward-Mills, N.L., Lew, K., Ampeh, Y., 2018. Survey research with a random digit dial national mobile phone sample in Ghana: Methods and sample quality. PLoS One 13, e0190902. https://doi.org/10.1371/journal.pone.0190902

Matsumoto, M., Nishimura, T., 1998. Mersenne Twister: A 623-Dimensionally Equidistributed Uniform Pseudo-Random Number Generator. ACM Trans. Model. Comput. Simul. 8, 3–30. https://doi.org/10.1145/272991.272995

Prosser, C., Mellon, J., 2018. The Twilight of the Polls? A Review of Trends in Polling Accuracy and the Causes of Polling Misses. Gov. Oppos. 53, 757–790. https://doi.org/10.1017/gov.2018.7

Sturgis, P., Kuha, J., Baker, N., Callegaro, M., Fisher, S., Green, J., Jennings, W., Lauderdale, B.E., Smith, P., 2018. An assessment of the causes of the errors in the 2015 UK general election opinion polls. J. R. Stat. Soc. Ser. A Stat. Soc. 181, 757–781. https://doi.org/10.1111/rssa.12329

Yiğit, O., 2020. Veba, Tifo, Kolera, Grip, Aids ve Koronavirüs… Pandemi Günlükleri… [WWW Document].

Covid19 Gerçek Vaka Sayısının Tespiti Rastgele Örneklem Alma

 APPENDIX-1

CONSTRUCTION AND EVALUATION OF THE RANDOM SUBSAMPLES OF INFORMATION FOR THE ASSESSMENT OF CONFIDENT POLL SIZES

Abstract

Random selection of people can lead to the use of small and unbiased samples for polling applications. This paper proposes a computer algorithm to generate random polls from simulated choices of population. This algorithm can be used to estimate how the error margins will change with the size of randomly-selected polls.

A case study was performed to construct such error margins for differently-sized ‘yes or no’ questionnaires. The results show that the minorities’ choice will be overestimated if the poll size is small. Also, the polls should be kept very large -at least 10 % of the population- to ensure that the minorities’ choice is predicted correctly. 

Introduction

Polling is a widely-used method to (i) gather insights about public opinion on any social topic, and (ii) to estimate information (e.g. gender, age, job, etc.) of a population. Polling is generally performed on small samples of a target population to save the associated costs on money, labor and time. There are two types of sample selection for polling, namely probabilistic and non-probabilistic sampling (Kim et al., 2018; Prosser and Mellon, 2018; Sturgis et al., 2018): The non-probabilistic sampling methods allow the people to volunteer for the polls, which may generate significant bias on the poll results.

On the other hand, the probabilistic (random) sampling is a promising technique where the probability of choosing a person is the same as the probability of choosing any other person in the population. This technique can allow for the use of very small polls to obtain unbiased results (Basin et al., 2018; Chaum, 2017; Sturgis et al., 2018).

This paper proposes a computer algorithm that includes a pseudorandom number generator (Matsumoto and Nishimura, 1998) to select random polls from the expected opinions of people in a simulated population. These random polls can be evaluated to determine how the error margins change with respect to the poll size (number of people conducting the poll). This observation will guide us to set a minimum sample size for confident polling as long as the samples are selected randomly.

Also, the random number generator (Matsumoto and Nishimura, 1998) used in the proposed algorithm may be integrated to the sampling tools such as random-digit-dialing (Brick and Tucker, 2007; L’Engle et al., 2018) and Alethea (Basin et al., 2018) for sample selection. However, integration of the random-number generator to polling applications are out of the scope of this paper.

For the purpose of this study, hypothetical ‘yes or no’ questionnaires are conducted from two simulated populations with distinct opinions. The results of this case study was used to (i) determine the relative errors between the poll results and the expected results in populations, and (ii) set a poll size above which any poll will produce confident results.

 Methodology

A simple flowsheet of the algorithm was developed to perform the following steps: Firstly, the algorithm simulated the expected information/opinion matrix of a target population. Secondly, it selected a random poll sample of any size from the population.

Finally, it calculated the relative error between the generated poll and the population results. This algorithm was looped multiple times to generate possible scenarios of polls of any size. The detailed description of the experimental flowsheet was provided below:

  1. Before the analyses, an artificial matrix data -denoted as population matrix- is generated in which each column will contain the information/opinion of each people in the target population. Meanwhile, each different information/opinion on this population matrix are labeled by using a different integer.
  2. The built-in DATASAMPLE function in MATLAB is used to randomly extract a subsample of any size – denoted as random poll matrix – from the population matrix. This function performs ‘k’ number of random permutations from 1 to the numerical value of population size (i.e. the number of people in the population). The resultant permutation matrix shows the positions in the population matrix that are selected to the random poll of size k. DATASAMPLE function was based on the Mersenne Twister algorithm (Matsumoto and Nishimura, 1998) that generates pseudorandom real numbers uniformly distributed in the closed interval [0,1].

Alternatively, the built-in RANDI function in MATLAB can be used to generate pseudorandom positive integers between 1 to the numerical value of population size at ‘k’ number of times. This function, which is also based on the Mersenne Twister algorithm (Matsumoto and Nishimura, 1998), will give the positions in the population matrix selected for the random poll of size k.   

  1. The data in the poll and population matrices are converted to two discrete distributions (histograms) with a common set of class variables. The relative errors of each class variable are calculated by the following formula:                                                                                                                                              (1)

RE is the relative error (%) of the selected class variable, freqpoll and freqpopulation are the frequencies (%) of the selected class variable in poll and population matrices, respectively.

Case Studies

Yes, or No questionnaire

Random polls were generated to estimate the relative proportions of yes and no results to a hypothetical question. The polls were generated from two different matrices where each matrix contains the data of yes or no opinion of 108 people (Table 1). These populations, in fact, also represent a wide range of the expected scenarios of any two-answer poll.

Table 1 Number of Yes or No Votes and Their Equivalent Frequencies in Two Different Populations (Population 1 and Population 2).

Population Type

Frequencies (%)

Number of Votes

Yes

No

Yes

No

Population 1

99.90

0.1

99,900,000

100,000

Population 2

50

50

50,000,000

50,000,000

 

Figure 6a and Figure 6b demonstrate cumulative distribution functions of ‘no’ votes (%) from random polls of various sizes that were constructed from Population 1 and Population 2 (Table 1), respectively. Both figures show that increasing the number of voters will contract the range of poll results so that the larger polls will give closer results to the expected choices of the population.

If the population gives the majority of its votes to one choice, the associated polls may give a wide span of results that are less likely to underestimate the frequency of minor choice (Figure 6a). This is an unexpected anomaly because the probability of catching the minorities’ votes from the population must have been smaller than the majorities’ votes. Nevertheless, Figure 6a suggests that this anomaly will gradually disappear if poll sizes are enlarged. If the population gives equal number of votes to both choices, the conducted polls may over or underestimate both choices at equal probabilities (Figure 6b). 

Şekil (Figure) 6 The CDF of no votes (%) from 100,000 poll results of a ‘yes or no’ questionnaire conducted to Population 1 (a) and Population 2 (b).

The next question is about determining the smallest poll size above which any poll will produce confident results. A suitable definition for this purpose would be the smallest size of all generated polls with a small error margin. Table 2 shows the relative errors on the percentage of ‘No’ votes predicted by polls of different size on Population 1 and Population 2. The table shows that polls of equal size produce a wider error range on the minor ‘No’ choice of Population 2 than the error range on the major ‘No’ choice of Population 1.

In other words, larger questionnaires are required to predict a certain choice correctly if the choice is to be given by the minority of the population. When the poll conductors cannot make a preliminary guess on whether a choice is given by the minority or majority of the population, it will be safer to keep polls large enough as if that choice is given by the minority. For this case study, the safe polls for a ‘yes or no’ questionnaire should be larger than 10 % of the population if the relative error on a major or a minor choice is to be reduced below 2 % (Table 2).

Table 2 The relative error ranges of differently-sized polls to estimate the percentage of ‘No’ votes in Population 1 and Population 2

Poll Size (% Population)

Number of Random Polls

Population 1 (No Votes = 50 % of the Population)

Population 2 (No Votes = 0.1 % of the Population)

Lower Bound

Upper Bound

Lower Bound

Upper Bound

0.001 %

100,000

12.6 %

12.8 %

100 %

700 %

0.01 %

4.40 %

4.26 %

100 %

170 %

0. 1 %

1.342 %

1.328 %

39 %

43 %

1 %

10,000

0.36 %

0.39 %

12.1 %

10.5 %

10 %

3,000

0.1072 %

0.1130 %

2.08 %

2.22 %

50 %

100

0.0248 %

0.0334 %

0.55 %

0.73 %

 

 Multiple Choice Questions

The current author(s) does/do not think of designing a case study on multiple-choice questions as it can be transformed into a two-answer choice and then evaluated. For example, let’s suppose that random polls are generated to estimate the relative proportions of n number of different choices to a hypothetical question.

This question can be made equivalent to the two-answer questionnaire (e.g. yes or no questionnaire) if only the votes of any single choice are collected while the remaining n-1 choices are collected into the cluster of “other” category. This allows us (i) to find the relative error margin for every single choice, then (ii) to estimate the safe poll sizes, as done in the ‘Yes or No’ questionnaires. Covid19 Gerçek Vaka Sayısının Tespiti Rastgele Örneklem Alma

Conclusions

This study uses a pseudorandom number generator to generate random polls from simulated choices of population. The random polls were used to investigate the effect of poll size on the results of a hypothetical two-answer questionnaire.

The simulated polls show that the minorities choice’ will be underestimated less likely if the poll size is small. Besides, the simulated polls show that sample sizes should be kept very high if the minorities’ choice has to be predicted correctly. 

References

Basin, D., Radomirovic, S., & Schmid, L. (2018). Alethea: A provably secure random sample voting protocol. Proceedings – IEEE Computer Security Foundations Symposium, 2018-July, 283–297. https://doi.org/10.1109/CSF.2018.00028

Brick, J. M., & Tucker, C. (2007). Mitofsky Waksberg: Learning From The Past. Public Opinion Quarterly, 71(5), 703–716. https://doi.org/10.1093/poq/nfm049

Chaum, D., 2017. Random-Sample Elections [WWW Document].

Kim, H., Jang, S. M., Kim, S. H., & Wan, A. (2018). Evaluating Sampling Methods for Content Analysis of Twitter Data. Social Media and Society, 4(2). https://doi.org/10.1177/2056305118772836

L’Engle, K., Sefa, E., Adimazoya, E. A., Yartey, E., Lenzi, R., Tarpo, C., … Ampeh, Y. (2018). Survey research with a random digit dial national mobile phone sample in Ghana: Methods and sample quality. PLOS ONE, 13(1), e0190902. https://doi.org/10.1371/journal.pone.0190902

Matsumoto, M., & Nishimura, T. (1998). Mersenne Twister: A 623-Dimensionally Equidistributed Uniform Pseudo-Random Number Generator. ACM Transactions on Modeling and Computer Simulation, 8(1), 3–30. https://doi.org/10.1145/272991.272995

Prosser, C., & Mellon, J. (2018). The Twilight of the Polls? A Review of Trends in Polling Accuracy and the Causes of Polling Misses. Government and Opposition, 53(4), 757–790. https://doi.org/10.1017/gov.2018.7

Sturgis, P., Kuha, J., Baker, N., Callegaro, M., Fisher, S., Green, J., … Smith, P. (2018). An assessment of the causes of the errors in the 2015 UK general election opinion polls. Journal of the Royal Statistical Society. Series A: Statistics in Society, 181(3), 757–781. https://doi.org/10.1111/rssa.12329

Covid19 Gerçek Vaka Sayısının Tespiti Rastgele Örneklem Alma

APPENDIX-2

clear all

 

Nufus=85*10^6;

evet=input(‘Enter the actual percentage of votes having COVID19 positive = ‘);

anketboyutu=input(‘Enter the number of people taking the tests = ‘);

tekrar=input(‘Enter number of survey replications = ‘);

 

hayir = 100-evet;

Numberevet=round(Nufus*evet/100); %  COVID19 pozitif kisi sayisi

Numberhayir=Nufus-Numberevet; % hasta olmayan kisi sayisi

 

Hayirmat=zeros(Numberhayir,1); % Satir (13). COVID19 negatif olan her kisi için 1 rakami ataniyor.

% Olusturulan matris, hasta olmayan kisi sayisi

% büyüklügünde ve 1 sütünluk bir matris olacak.

 

Evetmat=zeros(Numberevet,1);

for i=1:1:Numberevet

Evetmat(i)=1; % Satir (20-24). COVID19 pozitif olan her hasta için 1 rakami ataniyor.

% Olusturulan matris, toplam COVID19 pozitif hasta sayisi büyüklügünde

% ve 1 sütünlük bir matris olacak.

end

 

anketevet=zeros(tekrar,1); % Tekrarlanan anketlerde COVID19 % pozitif sonuçlarini alacak bos bir matris olusturduk. Bu matris, anket sayisi kadar sirasi ve 1 sütünü olan bir matris olacak.

ankethayir=zeros(tekrar,1); % Tekrarlanan anketlerde COVID19 % negatif sonuçlarini alacak bos bir matris oluiturduk. Bu matris, anket sayisi kadar sirasi ve 1 sütünü olan bir matris olacak.

Oylarmat= vertcat(Evetmat,Hayirmat); %COVID19 pozitif veya negatif kisilere ait 1 veya 0 bilgilerini içeren iki ayri matris tek bir büyük matrise dönüstürülüyor.

Oylarmat= datasample (Oylarmat,Nufus,1,’Replace’,false); % Bu built-in fonksiyon, eldeki yapay popülasyon matrisininden nüfüs miktarinca rastgele örnek çekiyor. Buradaki amaç yapay matris verisini karistirmak.

 

% Satir (4-35). Üstteki satirlarda, bütün Türkiye nüfusu için COVID19 durumunu gösteren

% basit yapay bir veritabani oluituruyoruz.

% Vatandaslara eger COVID19 pozitif

% ise numarasinin yanina 1, degilse 0 atiyoruz. Dolayisiyla nüfüs sayisinca

% satiri ve sadece 1 kolonu olan bir matris olusturuluyor.

 

for j=1:1:tekrar

Anketmat= datasample (Oylarmat,anketboyutu,1,’Replace’,false); % Bu satirdaki (Satir 47) built-in MATLAB fonksiyonu,

% yapay popülasyon matrisinden istediginiz miktarda rastgele örnek çekiyor. Buradaki for loopunda (Satir 46-57) amaç

% istediiiniz kadar tekrar yaparak bu populasyondan rastgele fakat eiit boyutta  numune kisi sayisi çekmek, sonrada her bir numunenin

% COVID19 test sonuçlarinin popülasyon’daki test sonuçlariyla ne kadar

% iliskili olup olmadigini bulmak.

anketevet(j)=100*sum(Anketmat)/anketboyutu;

ankethayir(j)=100-anketevet(j);

end

 

cdfplot(anketevet); %yapilan COVID19 test calismalarinda yuzde kac kiside COVID19 pozitif ciktiginin kumulatif dagilimi

 

ylabel(‘Cumulative Frequency (Fraction)’,’FontSize’, 12);

 

xlabel(‘COVID19 (%)’,’FontSize’, 12);

title (strcat(‘Beklenen COVID19 pozitif % = ‘, num2str(evet), ‘, ‘,num2str(anketboyutu),’ kisilik rastgele test calismalari, test calismasi sayisi = ‘, num2str(tekrar)),’FontSize’, 12);

hold on

line([evet,evet],[0,1],’LineStyle’,’–‘,’LineWidth’,2,’Color’,’black’) %Nufusta beklenen COVID19’lu hasta orani (%)

legend (‘CDF plot (Fraction)’,’Beklenen Deger’)

hold on

Covid19 Gerçek Vaka Sayısının Tespiti Rastgele Örneklem Alma

Yorum Yaz

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Şimdi Oku

Koronavirüs Salgınının Dünyada ve Türkiye’de Otomobil Satışlarına Etkisi

OTOMOTİVE KORONAVİRÜS ETKİSİ Koronavirüs pandemisinin başladığı 2019 yılının Aralık ayından bu yana ülkemizde ve tüm dünyada eğitimden ticarete, turizmden sanayiye...

Osmanlıdan günümüze 7 harika şerbet

Osmanlı döneminde su ve ilaç yerine kullanılan, kristal kadehler, buzdan kaseler içerisinde özenle servis edilen, satış fiyatı ve ikram...

Sonsuzluk Sonsuzluktan Büyüktür

Cantor tarafından geliştirilen sonsuz setler teoremine göre matematiksel olarak birbirinden farklı büyüklükte sonsuzlar olacağı ve hiç bir zaman en...

Ailenizle İzlemeniz Muhtemel 15 Film

15 Film Önerisi deyince aklıma Aile Filmleri geldi. işte size birbirinden ilginç 15 Film   1. PauliePapağan Paulie'nin sahibi küçük Marie'den...

Birbirinden Sürükleyici En İyi 10 Netflix Dizisi

10 Netflix Dizisi En popüler film, dizi, belgesel ve animasyon izleme platformlarından Netflix, birbirinden kaliteli yapımlara ev sahipliği yapıyor. Gerek...

Jason Statham’ın mutlaka izlemeniz gereken 10 filmi

İngiliz bir oyuncu olan Jason Statham, tüm dünyada aksiyon dolu filmleriyle büyük beğeni toplamaktadır. 1967 yılında İngiltere'de dansçı bir...

Le Mouvement Gastronomique en Ramadan

Nous voulons vous descrirer le goût des nourritures populaires quand les Musulmans consommeraient en le temps 'Sahur' et 'Iftar'...

гастрономическое движение в Рамадане

Мы хотим описать вам вкус популярных продуктов, когда мусульмане потребляют в Сахуре и Ифтаре драгоценного месяца «Рамадан». Мусульмане предпочитают...

Bilimsel Araştırma Derleme Makaleleri

  Bilimsel araştırma/derleme makaleleri, bir bilimsel çalışma alanı ile ilgili yapılmış araştırma sonuçlarını içeren yazıdır. Bilimsel derleme makaleler ise bir...

Bella Ciao! La Casa De Papel’in Birbirinden Çılgın Karakterleri

Netflix'in 2017 yılında tüm yayın haklarını satın aldığı İspanyol yapımı La Casa De Papel dizisi, tüm dünyada devasa bir...

Sokağa Çıkma Yasağı Nedir? Hangi şartlarda uygulanır?

Korononavirüs pandemisinin büyük bir hızla yayıldığı şu günlerde, ülkeler salgını kontrol altına almak için büyük gayret gösteriyorlar. Aşı çalışmalarının...

Mutlaka İzlenmesi Gereken En İyi 10 Film

İnternetten ne seyredeceğim diye düşünme diye işte sana Mutlaka İzlenmesi Gereken En İyi 10 Film 1 - ESARETİN BEDELİ (1994) Stephen...

Ödüllü 9 Tarihi Film

Şahsen izlediğim, beğendiğim ve izlemenizi tavsiye ettiğim bazısı Ödüllü 9 Tarihi filmin isimlerini ve bu filmlerin kısa sinopsislerini aşağıda yazıyorum....

Tozlandım

Düz Dar Etek Kalıbı Çizimi

Temel Dikiş Teknikleri – Teyel Çeşitleri

0
Teyel: İki ya da daha fazla kumaş üzerine yapılan geçici birleştirme işlemine “teyel” denir. Genellikle parçaları esas dikime hazırlamak için ön dikiş olarak yapılan,...

Sülfürlü Bakır Mineralleri

0
Sülfürlü Bakır Mineralleri... Bakır, çoğunlukla elektronik devrelerde iletken olarak kullanılan, sünekliliğe meyilli ve korozyonla aşınmaya dayanımlı olan bir elementtir.  Doğada nadir olarak elementel halde bulunmakta,...
aracinız kisa hazir mi_nettenyazar

Aracınız kışa hazır mı?

2
Havalar her geçen gün soğuyor... Aracınız kışa hazır mı? Geç kalmadan aracınızın kışlık bakımlarını yaptırın.. Bakımları ihmal etmek soğuk kış günlerinde aracınızla ilgili ciddi...
Düz Dar Etek Kalıbı Çizimi

Düz Dar Etek Kalıbı Çizimi

15
 Düz Dar Etek Kalıbı ÇizimiGerekli Bilgiler ve MalzemelerParşömen kağıdı, A4 kağıdı, cetvel , riga cetveli , kağıt makası , mezura , kalemBel ölçüsü =...
georges-melies-nettenyazar

Georges Melies

0
  Georges Melies 1861-1938 yılları arasında yaşamış Fransız illizyonist ve film yapımcısıdır. Melies, sinema tarihinin doğum döneminde keşfetmiş olduğu çekim teknikleri ve öykü anlatımları ile...
devridaim

Endüstriyel Devrim

0
 18. yüzyılın sonlarında İngiltere'de başlayıp 19.yüzyıl boyunca tüm dünyada süre gelen endüstriyel devrim dalgalar halinde meydana gelen bir seri teknolojik gelişmelerden oluşmaktadır. Endüsriyel Devrimin Başlangıcı Su,...
rutin_insan_nettenyazar

Rutin İnsan Örneği

0
Rutin insan... Pazartesi sabahı... Sendrom ! Komikliğe başlamak için kötü bir zamanlama. Kağıt fabrikasında kalite kontrol mühendisi olarak çalışıyorum. Kağıt fabrikası sonuçta, boyuna günlük yazılacabilecek...
şiir

Posta Şiiri

0
Posta Şiiri   Ah bu yalnızlık yok mu, öpülünce geçilen cinsinden… Niye insanlar hep en zoru seçiyor, ya da seçmek zorunda kalıyor? Niye sürekli okşanmak rahatsız eder insanı...
yakalamak

İlk Defa Başlayacaklar için Uçak Yolculuğu

1
  Merhaba, bu yazımızda uçak yolculuğu yapacaklar için genel bilgiler vermeye çalışacağız.  Deneyimlerimizi aktarmya çalışacağız, gene de her türlü bilgiyi uçuş yapacağınız havayolundan almanız sizin için...

Kalp Nedir? Kalbin Görev ve İşlevleri Nelerdir?

2
Kalp, öneminden dolayı canlı varlıkların hayat merkezi olarak kabul edilir. Her insanın kalbi kendi yumruğu büyüklüğünde olup, yumurta ve çam kozalağı şeklindedir. Sol göğsün...
cift_yarik_deneyi

Çift Yarık Deneyi – Quantum Mekaniği

0
Çift Yarık Deneyi, Thomas Young'un (1773-1829) 1800'lü yıllarda gerçekleştirdiği önemli bir deney olup (double-slit experiment); ışığın hem madde hem de dalga özelliği olduğunu göstermiş;...

Boncuktan Salon Takımı Nasıl Yapılır ? Grafikli Anlatım

3
Gerekli malzemeler:Çizmeli Naylon ip , Pense , 1 kilo Cam kum boncuk , 1/2 kilo Cam boru boncuk , Makas , Çakmak , Boncuk...

Biraz Ciddi Ol Ya...Çocuk Gibisin
Sen oku diye yazıldı