<div dir="ltr">Dear Gate Community,<div>I have created a simple Cone Beam CT simulator in order to obtain projections which will be fed to a reconstruction algorithm. In order for the algorithm to work, I need to have a large number of detected photons in each pixel of the detector. In order to obtain this large number, I wanted to run the simulation for ~10^13 primaries. This is of course an impossible job for my computer which has only 8 logical cores (4 after assigning half to the virtual machine on which Gate is run) so I will get access to a supercomputer which will be able to do this.</div><div><br></div><div>In the meantime, I wonder how I could maximize the performance on my computer? When I run the Gate simulation and monitor the CPU performance, I can see that only 1/4 logical cores is being used for the simulation.</div><div><br></div><div>In Gate documentation I found the '6.1. How to use Gate on a Cluster' explaining how I should use the <i>gjs </i>(Gate job splitter) which will split my work on 4 jobs which I can independently run on each node of the cluster, after which I should use the <i>gjm </i>(Gate file merger) in order to combine the results.</div><div><br></div><div>Several questions arose from this:</div><div>1. Is it possible to make Gate make the use of additional 3 cores that I have assigned to the virtual machine without doing the job splitting?</div><div>2. If I perform the job splitting, can my 4 cores be considered a cluster of it's own? </div><div>3. When running <i>gjs</i>, I am only able to get an output when am using <i>-numberofsplits</i> of 10 or more jobs. If I try to run it for 9 or less, I get 'floating point error'.</div><div>4. Since I am only running a simulation of 10^13 independent photon histories (only interested in photon interactions within a phantom and the count of the photons on the detector) would it be the same if I just fed the same simulation to on <i>n </i>nodes, with the number of primaries being 10^13/n?</div><div><br></div><div>For the first test for this simulator, I will be using it on a cylindrical phantom. Instead of making a large number of projections which will be fed to a reconstruction algorithm, I will be generating particles from only one angle and the result (2D matrix with the photon count) will be copied several hundred times and hopefully, upon reconstruction, we will get a circular cross-section. </div><div><br></div><div>All in all, I need a way to speed up the process of obtaining this 2D matrix if I am going to make the simulator more realistic. </div><div><br></div><div>Any suggestions on this matter would be extremely helpful. Thanks in advance!</div><div><br></div><div>Kind regards,</div><div>Mijat Paunović</div></div>