網(wǎng)站首頁(yè) 編程語言 正文
用于對(duì)內(nèi)存中的數(shù)據(jù)做并行運(yùn)算,也就是說其只支持 LINQ to Object 的并行運(yùn)算
一、AsParallel(并行化)
就是在集合后加個(gè)AsParallel()。
例如:
var numbers = Enumerable.Range(0, 100);
var result = numbers.AsParallel().AsOrdered().Where(i => i % 2 == 0);
foreach (var i in result)
Console.WriteLine(i);
下面我們模擬給ConcurrentDictionary灌入1500w條記錄,看看串行和并行效率上的差異,注意我的老爺機(jī)是2個(gè)硬件線程。
static void Main(string[] args)
{
var dic = LoadData();
Stopwatch watch = new Stopwatch();
watch.Start();
//串行執(zhí)行
var query1 = (from n in dic.Values
where n.Age > 20 && n.Age < 25
select n).ToList();
watch.Stop();
Console.WriteLine("串行計(jì)算耗費(fèi)時(shí)間:{0}", watch.ElapsedMilliseconds);
watch.Restart();
var query2 = (from n in dic.Values.AsParallel()
where n.Age > 20 && n.Age < 25
select n).ToList();
watch.Stop();
Console.WriteLine("并行計(jì)算耗費(fèi)時(shí)間:{0}", watch.ElapsedMilliseconds);
Console.Read();
}
public static ConcurrentDictionary<int, Student> LoadData()
{
ConcurrentDictionary<int, Student> dic = new ConcurrentDictionary<int, Student>();
//預(yù)加載1500w條記錄
Parallel.For(0, 15000000, (i) =>
{
var single = new Student()
{
ID = i,
Name = "hxc" + i,
Age = i % 151,
CreateTime = DateTime.Now.AddSeconds(i)
};
dic.TryAdd(i, single);
});
return dic;
}
public class Student
{
public int ID { get; set; }
public string Name { get; set; }
public int Age { get; set; }
public DateTime CreateTime { get; set; }
}
orderby,sum(),average()等等這些聚合函數(shù)都是實(shí)現(xiàn)了并行化。
二、指定并行度
這個(gè)我在前面文章也說過,為了不讓并行計(jì)算占用全部的硬件線程,或許可能要留一個(gè)線程做其他事情。
var query2 = (from n in dic.Values.AsParallel().WithDegreeOfParallelism(Environment.ProcessorCount - 1)
where n.Age > 20 && n.Age < 25
orderby n.CreateTime descending
select n).ToList();
三、了解ParallelEnumerable類
首先這個(gè)類是Enumerable的并行版本,提供了很多用于查詢實(shí)現(xiàn)的一組方法,下圖為ParallelEnumerable類的方法,記住他們都是并行的。
ConcurrentBag<int> bag = new ConcurrentBag<int>();
var list = ParallelEnumerable.Range
(0, 10000);
list.ForAll((i) =>
{
bag.Add(i);
});
Console.WriteLine("bag集合中元素個(gè)數(shù)有:{0}", bag.Count);
Console.WriteLine("list集合中元素個(gè)數(shù)總和為:{0}", list.Sum());
Console.WriteLine("list集合中元素最大值為:{0}", list.Max());
Console.WriteLine("list集合中元素第一個(gè)元素為:{0}", list.FirstOrDefault());
四、plinq實(shí)現(xiàn)MapReduce算法
mapReduce是一個(gè)非常流行的編程模型,用于大規(guī)模數(shù)據(jù)集的并行計(jì)算,非常的牛X啊,記得mongodb中就用到了這個(gè)玩意。
- map:? 也就是“映射”操作,可以為每一個(gè)數(shù)據(jù)項(xiàng)建立一個(gè)鍵值對(duì),映射完后會(huì)形成一個(gè)鍵值對(duì)的集合。
- reduce:“化簡(jiǎn)”操作,我們對(duì)這些巨大的“鍵值對(duì)集合“進(jìn)行分組,統(tǒng)計(jì)等等。
下面我舉個(gè)例子,用Mapreduce來實(shí)現(xiàn)一個(gè)對(duì)age的分組統(tǒng)計(jì)。
static void Main(string[] args)
{
List<Student> list = new List<Student>()
{
new Student(){ ID=1, Name="jack", Age=20},
new Student(){ ID=1, Name="mary", Age=25},
new Student(){ ID=1, Name="joe", Age=29},
new Student(){ ID=1, Name="Aaron", Age=25},
};
//這里我們會(huì)對(duì)age建立一組鍵值對(duì)
var map = list.AsParallel().ToLookup(i => i.Age, count => 1);
//化簡(jiǎn)統(tǒng)計(jì)
var reduce = from IGrouping<int, int> singleMap
in map.AsParallel()
select new
{
Age = singleMap.Key,
Count = singleMap.Count()
};
///最后遍歷
reduce.ForAll(i =>
{
Console.WriteLine("當(dāng)前Age={0}的人數(shù)有:{1}人", i.Age, i.Count);
});
}
public class Student
{
public int ID { get; set; }
public string Name { get; set; }
public int Age { get; set; }
public DateTime CreateTime { get; set; }
}
考慮一個(gè)簡(jiǎn)單的例子,現(xiàn)有一個(gè)容量為1000000的單詞集,需要我們以降序列出其中出現(xiàn)次數(shù)超過100000的單詞(和其次數(shù))。Map過程,使用PLINQ將集合按單詞分組,這里使用了Lookup容器接口,它與Dictionary類似,但是提供的是鍵-值集映射;Reduce過程,使用PLINQ歸約查詢即可。
某一次運(yùn)行結(jié)果如下:
Word: you, Count: 142416
Word: van, Count: 115816
Word: next, Count: 110228
原文鏈接:https://www.cnblogs.com/springsnow/p/9412885.html
相關(guān)推薦
- 2022-05-25 SpringBoot使用Aop實(shí)現(xiàn)分布式鎖
- 2022-04-12 如何解決:git push -u origin msster時(shí)出現(xiàn)error: failed to
- 2022-11-09 Python?Pandas讀寫txt和csv文件的方法詳解_python
- 2022-06-22 golang?API請(qǐng)求隊(duì)列的實(shí)現(xiàn)_Golang
- 2022-03-26 android獲取及監(jiān)聽手機(jī)網(wǎng)絡(luò)狀態(tài)_Android
- 2022-10-07 C語言實(shí)現(xiàn)動(dòng)態(tài)版通訊錄的示例代碼_C 語言
- 2024-03-06 CMake編譯Qt,生成簡(jiǎn)單窗口
- 2022-05-27 Jmeter通過OS進(jìn)程取樣器調(diào)用Python腳本實(shí)現(xiàn)參數(shù)互傳_python
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細(xì)win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運(yùn)行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲(chǔ)小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運(yùn)算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認(rèn)證信息的處理
- Spring Security之認(rèn)證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯(cuò)誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實(shí)現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡(jiǎn)單動(dòng)態(tài)字符串(SD
- arthas操作spring被代理目標(biāo)對(duì)象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊(duì)列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠(yuǎn)程分支