请帮助作一个概率估计

来源:百度知道 编辑:UC知道 时间:2024/06/05 02:57:26
请帮助作一个概率估计:

中国有960万平方公里,我们知道由于植物分布与气候、纬度、土壤等许多因素有关,并不
是完全随机的,如果现在随机调查1/1000即9600平方公里的植物种类,其植物种类反映中
国植物种类的代表性有多高?

我真正要探讨的问题是:
语言的分布与植物的分布有些类似。中文网页约有20亿个,现在随机下载1/1000即200万个
网页,提取其中的语句,分析构成语句的词语搭配,代表性有多高?
词语搭配,也可以说是短语,基本句式,如:
他毕业五年了
他早就毕业了
他明年六月毕业
--------他毕业

另一方面,一个语句也可以有多个“交叉”“重叠”的“基本句式”:
这人的英语说得不流利
-----------------这人说英语
-----------------英语流利
----------------不流利

估计可以有90%的几率代表90%的样本

天天要来哦~~

欢迎大家来我的空间
我每天下午更新20篇文章
觉得好的话就介绍给你的好友,谢谢了!这样就会另到更多人开心!!

这就是我的开心王国!!

个人感觉不高.因为你也说植物分布与气候、纬度、土壤等许多因素有关,按统计的观点应该把这些因素都考虑进行加权,更何况随机选取的都与平均的那个差距较大,可以考虑每个因素都选取些面积,至于你语言的分布,我不是很懂